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1974 年 ,数码 相机 之 父 塞 尚 发 明和 设计 了 第 一 台 基 于 CCD 的 数码 原型 机 ,从 此 ,数字 
图 像 技术 逐步 进入 了 大 众生 活 ; 20 世纪 60 年 代 末 ,阿波 罗 登 月 计划 实现 了 月 球 和 地 球 之 间 
数 以 万 计 的 图 像 传输 和 处 理 , 从 此 ,图 像 处 理 技术 引起 了 美国 ,中国 、 俄 罗斯 及 欧洲 一 些 科技 
大 国 的 重视 。 特 别 是 近 20 年 来 ,数字 图 像 处 理 技术 得 到 快速 发 展 , 随 着 人 工 智 能 .大 数据 、 
物 联网 .数字 地 球 、 智 慧 城市 、 机 器 人 技术 及 Internet 的 广泛 应 用 ,信息 传输 总 量 急剧 增长 。 
在 各 种 信息 中 ,图 像 信息 以 其 信息 量 大 和 直观 性 、 准 确 性 、 可 靠 性 等 一 系列 优点 ,成 为 人 类 获 
取信 息 的 主要 来 源 和 利用 信息 的 重要 手段 。 

现代 社会 ,图 像 处 理 技术 已 经 应 用 和 渗透 到 科学 研究 和 日 常生 活 的 方方面面 ,并 日 益 受 
到 重视 ,在 航天 、 军 事 、 医 学 、 科 学 研究 等 许多 领域 发 挥 着 越 来 越 重 要 的 作用 。 在 航空 航天 领 
域 ,图 像 处 理 技 术 已 被 用 于 高 效 \ 快 速 传输 从 宇宙 空间 拍摄 各 种 图 像 , 并 进行 快速 处 理 ,处 理 
结果 用 于 火箭 发 射 监控 、 飞 行 控 制 .姿态 调整 飞船 返回 等 ,或 用 于 资源 勘探 、 天 体 研究 、 地 图 
测绘 .气象 预报 、 大 气 污染 防 控 等 研究 。 近 年 来 ,我 国 成 功 发 秧 了 嫦娥 三 号 .天宫 2 号 、 天 舟 
1 号 飞船 ,无 论 发 射 和 回收 ,还 是 着 陆地 点 选择 ,发 射 过 程 监测 、 飞 行 控 制 . 舱 内 设备 控制 , 故 
障 检测 和 故障 唤醒 ,图 像 处 理 技术 始终 发 挥 着 不 可 替代 的 作用 。 在 生物 医学 工程 领域 ,图 像 
处 理 的 应 用 也 非常 广泛 , 它 已 用 于 各 种 射线 照片 .CT 成 像 .超声 影像 .内 窗 镜 像 、 核 磁 成 像 
分 析 , 帮 助 医生 对 疾病 进行 快速 \ 准 确诊 断 , 挽 回 了 无 数 人 的 生命 。 在 军事 领域 ,图 像 处 理 技 
术 已 成 功用 于 卫星 和 遥感 照片 识别 、 无 人 机 飞行 与 导航 、 高 精度 夜 视 瞄 准 设备 等 。 数 字 图 像 
处 理 技 术 的 应 用 不 胜 枚 举 , 基 于 图 像 处 理 技术 开发 出 来 的 现代 新 型 装备 ,其 很 多 功能 都 是 人 
工 难以 企及 的 。 

实践 的 需要 和 成 果 的 积淀 促进 了 图 像 处 理 技术 向 更 高 水 平 发 展 ,数字 图 像 处 理 技术 正 
是 在 这 种 应 用 的 迫切 需要 和 自身 的 不 断 发 展 之 中 得 到 迅速 发 展 的 学 科 。 未 来 ,图 像 处 理 技 
术 的 发 展 及 应 用 与 人 类 未 来 的 生活 联系 之 紧密 、 影 响 之 深远 是 不 可 估量 的 。 

本 书 共 分 12 章 , 内 容 可 以 分 为 3 大 部 分 。 第 1 部 分 (第 1,2 章 ) 是 数字 图 像 处 理 的 基础 
知识 ,主要 内 容 包 括 图 像 处 理学 科 概 况 ,图 像 处 理 系统 、 研 究 内 容 、 基 本 概念 、 图 像 类 型 .图 像 
数字 化 方法 .图像 文 件 基本 格式 、 图 像 质 量 评价 \、 灰 度 直方 图 及 图 像 的 统计 特征 等 。 第 2 部 
分 (第 3 一 9 章 ) 是 数字 图 像 处 理 的 核心 内 容 , 系 统 地 讨论 了 数字 图 像 处 理 中 的 各 种 基本 理 
论 . 算 法 和 应 用 ,包括 图 像 处 理 中 的 各 种 变换 方法 、 图 像 基本 运算 、 图 像 空 域 增强 、 图 像 频 域 
增强 、 彩 色 图 像 处 理 .图 像 复原 和 图 像 编码 等 。 第 3 部 分 (第 10 一 12 章 ) 是 图 像 分 析 方面 的 
重要 内 容 , 由 浅 和 人 深 地 介绍 了 图 像 分 割 与 边缘 检测 、 数 学 形态 学 .图 像 特征 与 理解 方面 的 内 
容 , 为 深入 应 用 奠定 坚实 的 基础 。 

本 书 是 作者 在 多 年 从 事 图 像 处 理 开 发 和 教学 科研 的 基础 上 撰写 而 成 的 ,力图 体现 以 下 
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三 个 特点 : 第 一 ,将 图 像 处 理 理论 和 图 像 处 理 的 应 用 紧密 结合 起 来 ,理论 严谨 、 概 念 清晰 、 结 
构 合理 ,系统 介绍 数字 图 像 处 理 技 术 的 知识 、 内 容 和 应 用 领域 ,使 读者 对 数字 图 像 处 理学 科 
有 一 个 全 面 的 了 解 ; 第 二 ,紧密 结合 相关 专业 本 科 生 和 研究 生 的 培养 规划 ,介绍 图 像 处 理 技 
术 方 面 的 新 理论 .新 技术 、 新 标准 和 新 应 用 ,使 读者 充分 了 解 图 像 处理 技 术 的 新 发 展 和 新 应 
用 ; 第 三 ,注重 理论 和 实际 的 结合 ,各 有 关 章 节 内 容 既 具有 一 定 的 理论 深度 ,也 对 典型 的 应 
用 做 了 较 详细 的 介绍 ,各 章 均 安排 了 重要 应 用 实例 ,为 读者 编程 和 进一步 的 应 用 研究 打下 扎 

本 书 可 作为 高 等 院 校 电子 信息 工程 .通信 工程 .信息 与 信号 处 理 . 电 子 科学 技术 .信息 工 
程 . 计 算 机 科学 与 技术 .软件 工程 .自动 化 .电气 工程 .生物 医学 工程 、 物 联网 .电视 技术 和 于 
感 遥测 等 相关 专业 的 高 年 级 学 生 和 研究 生 的 图 像 处 理 教材 ,也 可 以 作为 工程 技术 人 员 或 其 
他 相关 人 员 的 参考 书 。 为 方便 教学 ,本 书 同步 更 新 了 电子 教案 及 教材 的 全 部 源 程序 ,如 有 需 
要 ,可 到 清华 大 学 出 版 社 网 站 下 载 或 与 作者 联系 。 

在 本 书 的 撰写 过 程 中 ,西安 电子 科技 大 学 姜 建 国教 授 提 出 了 宝贵 意见 ,清华 大 学 信息 工 
程 学 院 电 子 信息 系 章 航 晋 教授 提出 了 有 益 的 建议 ,在 2017 年 11 月 召开 的 教育 部 电子 信息 
类 专业 教学 指导 委员 会 会 议 上 还 听取 了 很 多 专家 的 建议 ,在 此 表示 衷心 的 感谢 。 

由 于 作者 水 平 有 限 , 书 中 缺点 和 玖 漏 之 处 在 所 难免 ,县 请 读者 批评 指正 。 欢 迎 读者 对 本 
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第 1 章 数字 图 像 处 理 概论 


CHAPTER 1 


从 胶片 相机 的 问世 ,到 数码 相机 的 普及 ,都 标志 着 图 像 处 理 技术 进入 到 了 人 们 的 日 常生 
活 之 中 ,数字 图 像 处 理 技术 只 有 几 十 年 的 历史 ,是 一 门 既 年 轻 又 酝酿 着 巨大 潜力 的 学 科 , 同 
寺 它 又 是 一 门 充满 活力 的 交叉 学 科 , 它 与 数学 .光学 、 信 息 科学 .工程 技术 .计算 机 技术 .人 工 
智能 和 航天 技术 等 众多 学 科 密切 相关 。21 世纪 人 类 已 进入 了 数字 智能 时 代 ,数字 图 像 处 理 
技术 的 重要 性 将 越 来 越 凸 显 ,其 应 用 领域 将 越 来 越 广泛 ,从 早期 的 军用 和 医学 等 个 别 领域 发 
展 到 现代 工业 农业、 军事 、 地 理 信息 、 采 矿 、 气 象 预报 、 医 学 、 航 空 航天 、 地 质 勘探 、 公 安 、 边 
防 、 美 术 设 计 、 游 戏 , 网 购 等 国民 经 济 和 社会 生活 的 各 个 领域 。 数 字 图 像 处 理 的 作用 和 魅力 
正 日 益 显 现 , 它 几乎 吸引 了 从 科学 家 到 平民 百姓 的 普遍 关注 。 可 以 预见 , 随 着 人 工 智能 时 代 
的 到 来 ,数字 图 像 处 理 技术 的 应 用 将 会 更 为 普及 和 深入 。 


1.1 数字 图 像 处 理 的 产生 


21 世纪 是 一 个 智能 信息 的 时 代 , 大 数据 研究 表明 ,人 们 日 常生 活 中 所 接收 的 信息 总 量 ， 
80% 左 右 来 源 于 图 像 信 息 , 从 这 一 角度 看 ,“ 百 闻 不 如 一 见 ” 正 是 图 像 处 理 重 要 性 的 形象 表达 
和 经 验 总 结 。 因 此 ,图 像 是 人 类 获取 信息 、 表 达 信 息 和 传递 信息 的 重要 手段 ,是 人 类 感知 和 
认识 世界 的 基础 。 

图 像 处 理 技术 的 早期 应 用 较为 单一 ,图 像 处 理 的 目的 是 改善 和 提高 图 像 质 量 , 即 主要 考 
虑 以 人 为 对 象 , 以 改善 人 的 视觉 效果 为 目的 。 在 图 像 处 理 中 ,输入 的 是 质量 低 的 图 像 , 输 出 
的 是 改善 质量 后 的 图 像 。 常 用 的 图 像 处 理 方法 有 图 像 增强 、 复 原 、 编 码 、 压 缩 等 。 现 代数 字 
图 像 处 理 技术 始 于 20 世纪 60 年 代 , 它 受益 于 微 电 子 技术 的 快速 发 展 、 计 算 机 运算 速度 的 迅 
速 提升 和 快速 算法 的 出 现 , 从 而 使 得 图 像 处 理 算 法 可 以 在 计算 机 上 真正 实现 。 这 一 时 期 , 美 
国 NASA 开始 处 理 飞 船 从 月 球 发 回 的 照片 ,标志 着 数字 图 像 处 理 技术 开始 在 军事 和 尖端 科 
技 行业 得 到 实际 应 用 。 

首次 大 规模 成 功 应 用 图 像 处 理 技术 的 是 美国 喷气 推进 实验 室 (JPL)。1964 年 ,美国 
JPL 实验 室 在 图 像 处 理 的 研究 和 应 用 方面 进行 了 开拓 性 的 工作 。 图 像 处 理工 程 师 利 用 “ 徘 
徊 者 7 号 ?发 回 的 数 千 张 月 球 照 片 ,使 用 计算 机 及 图 像 处 理 设备 ,在 充分 考虑 了 太阳 位 置 和 
月 球 环境 对 照片 影响 的 基础 上 ,采用 灰 度 变换 .去 噪声 ,几何 校正 、 传 里 叶 变换 以 及 二 维 线性 
滤波 等 方法 对 图 片 进行 处 理 , 由 计算 机 第 一 次 绘制 了 月 球 表 面 地 图 。 随 后 ,1965 年 又 对 *“ 徘 
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徊 者 8 号 ?发 回 的 几 万 张 照片 进行 解 卷 积 和 消除 运动 模糊 等 较为 复杂 的 处 理 , 使 图 像 质量 进 
一 步 提高 ,由 计算 机 成 功 地 绘制 出 月 球 表面 地 图 。 后 来 又 对 探测 飞船 发 回 的 近 十 万 张 照片 
进行 更 为 复杂 的 图 像 处 理 , 获 得 了 月 球 的 地 形 图 彩色 图 及 全 景 镶 骨 图 ,为 人 类 登 月 创举 更 
定 了 坚实 的 基础 ,也 推动 了 数字 图 像 处 理 这 门 学 科 的 诞生 。 从 此 ,数字 图 像 处 理 被 广泛 应 用 
于 航空 .航天 以 及 遥感 遥测 等 尖端 领域 并 发 挥 着 越 来 越 重 要 的 作用 。 

在 我 国 ,图 像 处 理 技术 给 人 们 带 来 巨大 的 震撼 也 常 发 生 在 航天 领域 。 虽 然 我 国航 天 技 
术 一 直 走 在 世界 前 列 , 但 一 直 在 低调 中 奋进 ,2013 年 6 月 11 日 “神舟 十 号 ”飞船 成 功 发 射 ， 
2017 年 4 月 20 日 “天 舟 一 号 ?货运 飞船 在 文昌 航天 发 射 中 心 由 长 征 七 号 遥 二 运载 火箭 成 功 
发 射 升 空 。 正 是 数字 图 像 处 理 技术 ,使 人 们 近 距 离 感触 到 了 我 国航 天 技术 的 先进 水 平 ,即便 
人 们 是 不 出 户 ,也 可 以 详细 地 观看 到 航天 员 杨 利 伟 、 悬 海 胜 、 张 晓 光 、 王 亚 平 、 刘 洋 在 “神舟 ” 
系列 “天 舟 ” 系 列 飞船 上 进行 太空 探索 和 科学 试验 活动 。 

数字 图 像 处 理 技术 的 另 一 个 重要 应 用 是 医学 领域 。1972 年 ,英国 EMI 的 工程 师 
Housfield 发 明了 用 于 头颅 诊断 的 X 射线 计算 机 断层 摄影 装置 , 即 通 常 所 说 的 CT 
(computer tomograph)。CT 的 基础 方法 是 根据 人 的 头 部 截面 的 投影 ,经 计算 机 处 理 来 重建 
截面 图 像 , 称 为 图 像 重 建 。1975 年 ,EMI 又 成 功 研制 出 全 身 用 的 CT 装置 ,可 获得 人 体 各 个 
部 位 清晰 的 断层 图 像 。 由 于 图 像 处 理 技术 这 一 应 用 的 重大 意义 ,这 一 无 损伤 诊断 技术 的 英 
国 研究 者 Housfield 和 美国 研究 人 员 Commack 获得 了 1979 年 诺 贝 尔 奖 ,这 说 明 图 像 处 理 
技术 对 人 类 做 出 了 划时代 的 贡献 。 

美国 在 卫星 遥感 .军事 、 气 象 等 领域 开始 广泛 应 用 数字 图 像 处 理 技术 ,快速 推动 了 数字 
图 像 处 理 技 术 的 发 展 ,而 这 一 时 期 ,也 正 是 全 球 微 电 子 技术 走 上 快速 发 展 的 初期 ,包括 CPU 
处 理 器 \ 海 量 存 储 器 、 图 像 数 字 化 和 图 像 显 示 以 及 计算 机 硬件 设备 不 断 降价 ,客观 上 推动 了 
该 技术 的 发 展 和 深入 应 用 。 也 正 是 这 一 时 期 ,美国 开始 将 图 像 处 理 技 术 从 军事 领域 扩展 应 
用 到 了 工业 和 民用 领域 ,开始 利用 卫星 云图 进行 天 气 预 报 ,并 利用 卫星 遥感 监测 全 球 气 候 ， 
在 公众 安全 领域 开始 使 用 指纹 识别 、 人 脸 识 别 技 术 , 数 字 图 像 处 理 技术 为 美国 社会 带 来 了 巨 
大 的 经 济 和 社会 效益 。 

借助 于 信息 技术 和 图 像 处 理 技术 的 领先 优势 ,20 世纪 90 年 代 , 美 国 提出 了 “数字 地 球 ” 
的 概念 。 显 然 , 图 像 是 构成 “数字 地 球 ” 的 信息 基础 ,不 同 的 遥感 平台 提供 的 多 源 遥 感 图 像 为 
数字 地 球 这 一 概念 提供 了 基础 信息 支撑 。 今 天 ,数字 图 像 处 理 技术 已 经 应 用 到 科学 研究 的 
众多 领域 ,数字 图 像 处 理 技术 对 科学 研究 .国民 经 济 甚至 人 类 社会 的 发 展 具 有 深远 的 意义 。 

首先 ,图 像 处 理 技术 是 人 类 视觉 延伸 的 重要 手段 。 数 字 图 像 处 理 技 术 从 宏观 上 扩展 了 
人 类 视觉 可 触及 的 距离 。2017 年 4 月 27 日, 我国 “天 舟 一 号 ”货运 飞船 实现 了 与 “天 富 二 
号 ”的 首次 推进 剂 在 轨 补 加 试验 ,借助 于 图 像 处 理 与 通信 技术 .人 们 坐 在 家 中 就 能 观看 到 这 
一 尖端 科技 壮举 ,看 到 了 我 国航 天 事业 的 巨大 成 就 。 

其 次 ,数字 图 像 处 理 技术 拓宽 了 人 类 获取 信息 的 渠道 和 窗口 。 对 于 人 有 眼 来 说 是 模糊 的 
或 者 不 可 见 的 图 像 ,通过 图 像 增 强 技术 或 其 他 处 理 方法 ,可 以 使 模糊 图 像 变 得 清晰 明亮 ,使 
不 可 见 图 像 变 为 视觉 可 见 图 像 。 人 类 视觉 系统 只 能 看 到 电磁 波谱 中 很 窄 范围 的 可 见 光 部 
分 ,紫外 波段 .红外 波段 和 微波 等 波段 对 人 眼 都 是 不 可 见 的 ,但 以 现 阶段 的 科技 水 平 , 却 可 以 
利用 红外 、 微 波 等 波段 的 信息 进行 数字 成 像 , 通 过 数字 图 像 处 理 技术 将 不 可 见 的 波谱 信息 变 
为 可 见 图 像 信息 。 现 代 医 学 也 正 是 利用 了 数字 图 像 处 理 技术 ,将 不 可 见 的 X 射线 进行 成 
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像 。 遥 感 融 测 技术 也 是 非常 典型 的 例子 ,陆地 卫星 的 TM 多 光谱 图 像 就 充分 利用 了 波长 为 
0.78 一 0. 94pm 的 近 红 外 波段 来 探测 植被 信息 和 生长 情况 ,获取 植被 宏观 信息 ; 利用 波长 
为 10. 4 一 12. 5pm 的 热 红 外 波段 可 监测 地 表 大 气 层 的 热源 污染 情况 ,无 论 是 近 红 外 波段 还 
是 热 红 外 波段 ,都 是 不 可 见 波谱 信息 。 

数字 图 像 处 理 技术 可 以 提高 人 类 对 信息 的 识别 精度 和 识别 能 力 。 通 过 数字 图 像 处 理 技 
术 , 可 以 将 人 眼 无 法 识别 的 图 像 进行 识别 和 分 类 处 理 。 指 纹 识别 是 一 个 典型 的 例子 ,人 眼 很 
难 区 分 识别 不 同 个 体 的 指纹 ,而 计算 机 通过 图 像 识 别 技术 却 可 以 快速 准确 地 检索 、 匹 配 和 识 
别 数 十 亿 级 别 的 不 同 个 体 的 指纹 。 

此 外 ,数字 图 像 处 理 技术 可 以 帮助 人 们 更 加 客观 \、 准 确 、 快 速 地 了 解 世界 和 认识 世界 。 
人 类 的 视觉 系统 可 以 帮助 人 类 从 外 界 获得 80% 左 右 的 信息 ,而 图 像 图 形 是 表示 和 传递 信 
息 的 最 佳 载体 。 现 阶段 , 绝 大 多 数 人 都 没有 登 上 过 月 球 , 但 通过 ”嫦娥 三 号 ”月球 探测 器 以 及 
“ 玉 免 号" 月球 车 从 月 球 传 回 的 高 清晰 月 球 图 像 ,人 们 能 准确 地 了 解 了 月 球 的 概貌 。 

今天 ,数字 图 像 处 理 技术 已 经 广泛 .深入 地 应 用 于 国民 经 济 的 各 个 领域 。 在 医学 和 生物 
工程 领域 ,X 射线 CT、 核磁 共振 等 技术 已 经 广泛 用 于 临床 诊断 ; 在 军事 .航天 和 国土 资源 
监测 领域 ,卫星 于 感 图 像 技 术 已 广泛 应 用 于 情报 获取 以 及 所 有 与 地 球 资源 相关 的 矿产 勘探 、 
资源 监测 ,水 土 流失 等 方面 的 监测 ; 在 公共 安全 领域 ,指纹 识别 ` 人 脸 识别 .虹膜 识别 技术 已 
得 到 广泛 的 应 用 ,数字 安保 系统 已 经 在 联合 国 及 奥运 会 等 各 种 重要 场所 发 挥 着 不 可 替代 的 
重要 作用 。 


1.2 数字 图 像 处 理 的 基本 概念 


人 出 生 以 后 ,一 睁 开眼 睛 就 开始 接收 各 种 各 样 的 图 像 信息 ,因此 有 人 说 ,图 像 与 生 俱 来 
是 人 类 生活 中 最 直观 .最 丰富 和 最 生动 的 信息 表示 形式 。 但 对 于 数字 图 像 处 理学 科 而 言 ,图 
像 的 定义 并 非 是 不 言 自 明 的 ,为 研究 和 讨论 的 需要 ,应 建立 一 个 科学 .统一 的 概念 。 


1.2.1 图 像 及 其 类 型 


数字 图 像 处 理 (digital image processing) 又 称 为 计算 机 图 像 处 理 , 它 是 指 通过 计算 机 对 
图 像 进行 去 除 噪声 .增强 .变换 复原、 分 割 、 特 征 提取 、 识 别 等 运算 与 处 理 。 

图 像 包括 各 种 各 样 的 形式 : 可 见 图 像 和 非 可 视图 像 ; 抽象 图 像 和 实际 图 像 ; 适 于 和 
不 适 于 计算 机 处 理 的 图 像 。 因 此 ,不 同 种 类 的 图 像 大 量 存在 于 人 类 生活 之 中 。 然 而 尽管 大 
家 天 天 接触 图 像 , 也 知道 什么 是 图 像 ,但 对 图 像 却 没有 严格 的 定义 。 

在 韦 氏 (Webster) 英文 词典 中 ,图 像 (image) 一 词 的 英文 定义 是 “an imitation or 
representation of a person or thing,drawn,painted,photographed…”, 即 图 像 是 人 或 事物 的 
一 个 逼真 模仿 或 描述 …… 著名 图 像 专家 Castleman 博士 将 图 像 定义 为 “在 一 般 意义 下 ,一 幅 
图 像 是 一 个 物体 或 对 象 (objects) 的 另 一 种 表示 ”。 例 如 ,美国 总 统 布什 的 照片 是 他 某 时 刻 出 
现在 镜头 前 的 一 种 描述 或 表示 。 因 此 ,图 像 是 其 所 表示 物体 或 对 象 信息 的 一 个 直接 描述 和 
浓缩 表示 。 简 而 言 之 , 即 图 像 是 物体 在 平面 坐标 上 的 直观 再 现 。 因 此 ,一 幅 图 像 包 含 了 所 表 
示 物 体 的 描述 信息 和 特征 信息 ,或 者 说 图 像 是 与 之 对 应 的 物体 或 对 象 的 一 个 真实 表示 ,这 个 
表示 可 以 通过 某 些 技术 手段 实现 。 
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日 常生 活 中 可 能 会 遇 到 各 种 各 样 的 图 像 , 如 非 光学 数字 图 像 .高 维 图 像 ( 维 数 等 于 或 大 
于 3) ,多 光谱 图 像 , 非 均匀 采样 图 像 、 非 均匀 量化 图 像 等 。 图 像 的 分 类 方法 也 多 种 多 样 , 通 
常情 况 下 , 图像 可 根据 其 形式 或 产生 方法 进行 分 类 。 目 前 被 一 致 接受 的 分 类 方法 是 
Castleman 博士 所 采用 的 基于 集合 论 的 分 类 方法 ,如 图 1-1 所 示 。 如 果 考 虑 所 有 物体 的 集 
合 ,图 像 便 形成 了 其 中 的 一 个 子 集 ,在 图 像 子 集中 的 每 幅 图 像 都 和 它 所 表示 的 物体 存在 对 应 
关系 。 根 据 图 像 的 产生 方法 ,图 像 可 以 分 为 如 下 三 类 。 


图 1-1 图 像 的 基本 类 型 


1. 可 见 图 像 

可 见 图 像 (visible images) 是 指 视觉 系统 可 以 直接 看 见 的 图 像 ,这 也 是 大 多 数 人 在 日 常 
生活 中 所 见 到 的 和 所 理解 的 图 像 ,这 一 类 图 像 一 般 通 过 照 像 .手工 绘制 等 传统 方法 获得 , 通 
常 计算 机 不 能 直接 处 理 , 但 经 过 数字 化 处 理 后 可 变 为 数字 图 像 。 在 该 集合 中 又 包含 几 种 不 
同方 法 产生 的 图 像 子 集 , 其 中 一 个 子 集 为 图 片 (picture), 包 括 照 片 (photograph)、 图 
(Cdrawing) 和 画 (painting); 男 一 个 子 集 为 光学 图 像 (optical image) , 即 用 透镜 、 光 栅 和 全 息 
术 产 生 的 图 像 。 

2. 物理 图 像 

物理 图 像 (physical image) 所 反映 的 是 物体 的 电磁 波 辐射 能 ,包括 可 见 光 和 不 可 见 光 图 
像 。 例 如 ,光学 图 像 是 光 强 度 的 空间 分 布 ,它们 能 被 肉眼 所 看 到 ,因此 也 是 可 见 的 图 像 。 不 
可 见 物理 图 像 的 例子 包括 温度 、 压 力 、 高 度 以 及 人 口 密度 等 的 分 布 图 。 物 理 图 像 一 般 可 以 通 
过 某 一 种 光电 技术 获得 ,第 一 类 图 像 中 的 照片 也 可 以 归 入 此 类 。 物 理 图 像 的 一 个 重要 子 集 
是 多 光谱 图 像 , 包 含 物体 的 近 红 外 、 中 红外 、 热 红外 等 波谱 信息 。 绝 大 部 分 的 物理 图 像 也 是 
数字 图 像 。 多 光谱 图 像 的 每 一 个 点 所 包含 的 不 只 是 一 个 局 部 特性 ,如 红 、 绿 、 蓝 三 光谱 图 像 ， 
它 的 技术 原理 普遍 用 于 彩色 照相 技术 和 彩色 电视 等 实际 应 用 当中 。 黑 白 图 像 在 每 个 点 只 有 
一 个 亮度 值 ,而 彩色 图 像 则 在 每 个 点 具有 红 、 绿 、 蓝 三 个 亮度 值 ,这 三 个 值 表示 在 不 同 波段 上 
的 强度 ,就 是 人 眼看 到 的 不 同 颜色 。 
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3. 数学 图 像 
数学 图 像 (maths image) 指 由 连续 函数 或 离散 函数 生成 的 抽象 图 像 。 其 中 离散 函数 所 
生成 的 图 像 就 是 计算 机 可 以 处 理 的 数字 图 像 。 


1.2.2 ”图像 与 数字 图 像 


图 像 是 其 所 表示 物体 的 信息 的 直接 描述 和 概括 表示 。 一 般 而 言 ,由 于 图 像 传感器 的 性 
能 和 成 像 角度 原因 ,一 幅 图 像 所 包含 的 信息 应 比 原 物 体 所 包含 的 信息 要 少 ,因此 一 幅 图 像 并 
非 是 该 物体 的 一 个 完全 、 精 确 的 表示 ,但 却 是 一 个 直观 和 恰当 的 表示 。 
以 数学 方法 描述 图 像 时 ,图 像 可 以 认为 是 空间 各 个 坐标 点 上 光照 强度 的 集合 。 也 就 是 
说 ,从 物理 、 光 学 和 数学 的 层面 看 ,一 幅 图 像 可 以 被 看 作物 体 辐射 能 量 的 空间 分 布 ,这 个 分 布 
是 空间 坐标 .时间 和 波长 的 函数 , 即 
T= f(r,y,z,A3t) (1-1) 
对 于 静止 图 像 , 式 (1-1) 与 时 间 1 无关 ; 对 于 单 色 图 像 , 式 (1-1) 与 波长 4 无 关 ; 对 于 二 
维 平面 图 像 , 式 (1-1) 与 空间 的 第 三 维 坐标 变量 > 无 关 。 
因此 ,一 幅 二 维 平面 图 像 可 以 用 二 维 光 辐 射 强度 的 分 布 函数 (也 称 为 亮度 函数 ) 表 示 , 即 
1= f(z,y) (1-2) 
如 果 说 图 像 是 与 之 对 应 的 物体 的 一 个 表示 ,那么 数字 图 像 可 以 定义 为 一 个 物体 的 数字 表示 ， 
或 者 说 是 对 一 个 二 维和 矩阵 施加 一 系列 的 操作 ,以 得 到 所 期 望 的 结果 。 其 中 ,数字 指 采 用 数字 
方法 对 离散 像素 单元 进行 的 有 关 处 理 和 计算 ,像素 即 离散 的 单元 ,处 理 是 指 让 某 个 事物 经 过 
某 一 过 程 的 作用 ,过 程 即 指 为 实现 期 望 目标 而 进行 的 一 系列 操作 。 
因此 ,数字 图 像 处 理 可 以 定义 为 对 一 个 物体 的 数字 表示 施加 一 系列 的 操作 ,以 得 到 所 期 
望 的 结果 。 其 过 程 表现 为 由 一 幅 图 像 变 为 另 一 幅 经 过 修改 或 改进 的 图 像 , 是 一 个 由 图 像 到 
图 像 的 过 程 。 而 数字 图 像 分 析 则 是 指 将 一 幅 图 像 转化 为 一 种 非 图 像 的 表示 。 在 图 片 的 例子 
中 ,处 理 的 过 程 就 是 改变 图 片 使 其 达到 某 一 预定 目标 ,或 使 其 更 满意 或 更 具 吸 引力 。 通 常情 
况 下 , 若 无 特 别 声 明 ,数字 图 像 是 指 一 个 被 采样 和 量化 后 的 二 维 强度 函数 ,采用 等 间距 矩形 
网 格 采样 ,对 幅度 进行 等 间隔 量化 。 也 可 以 说 ,一 幅 数字 图 像 是 一 个 被 均匀 采样 和 均匀 量化 
〈 即 离散 处 理 ) 的 二 维 数值 矩阵 。 


1.2.3 ”其 他 相关 概念 


计算 机 图 形 学 (computer graphic) 是 指 利用 计算 机 技术 将 概念 或 数学 描述 所 表示 的 物 
体 ( 非 实物 ) 图 像 进行 处 理 和 显示 的 过 程 。 其 侧重 点 在 于 根据 给 定 物 体 的 数学 描述 模型 生成 
一 幅 图 像 。 从 一 定 意义 上 说 ,如 将 计算 机 图 像 学 和 图 像 分 析 相 比较 ,那么 两 者 处 理 的 对 象 和 
输出 结果 正好 相反 ,计算 机 图 形 学 是 将 非 图 形式 的 数据 描述 生成 图 像 。 
计算 机 视觉 (computer vision) 是 指 利 用 计算 机 、 传 感 器 及 相关 设备 模拟 生物 的 视觉 功 
能 ,主要 目的 是 通过 对 传感器 采集 到 的 图 像 或 视频 信息 进行 处 理 ,理解 自然 场景 的 二 维 或 三 
维 信 息 。 在 机 器 人 领域 中 ,计算 机 视觉 为 机 器 人 提供 类 似 人 类 视觉 的 功能 。 

图 像 的 运算 (operation) 可 分 为 三 类 。 第 一 类 是 全 局 运算 ,此 类 运算 是 对 整 幅 图 像 进行 
相同 的 处 理 。 第 二 类 是 点 运算 ,其 输出 图 像 每 个 像素 的 灰 度 值 只 依赖 输入 图 像 对 应 点 的 灰 
度 值 。 点 运算 有 时 称 为 对 比 度 运算 或 对 比 度 拉 伸 。 第 三 类 是 局 部 运算 , 它 的 输出 图 像 上 每 个 
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像素 的 灰 度 值 是 根据 输入 图 像 中 以 对 应 像素 为 中 心 的 邻 域 中 多 个 像素 的 灰 度 值 计 算出 来 的 。 

噪声 (noise) 一 般 是 指 加 性 的 或 乘 性 的 非 图 像 本 源 信息 , 即 图 像 的 污染 信息 。 

像素 (pixel) 是 指 在 由 一 个 数字 序列 表示 的 图 像 中 的 一 个 最 小 单位 , 称 为 像素 。 

对 比 度 (contrast) 是 指 一 幅 图 像 中 灰 度 反差 的 大 小 。 

采样 密度 (sampling density) 是 指 在 图 像 上 单位 长 度 所 包含 的 采样 点 数 。 采 样 密度 的 
倒数 即 像素 间距 (pixel spacing) 。 

放大 率 (magnification) 指 图 像 中 物体 与 其 所 对 应 的 实际 景物 中 物体 的 大 小 比例 关系 。 
该 定义 只 能 用 于 线性 几何 关系 , 即 在 图 像 和 景物 中 可 以 定义 相同 的 测量 单位 ,而 且 这 个 比例 
在 全 图 中 是 一 致 的 。 

数字 化 (digitizing) 是 将 一 幅 图 像 从 其 原来 的 形式 转换 为 数字 形式 的 处 理 过 程 。“ 转 换 ” 
是 非 破坏 性 的 。 从 计算 机 信息 处 理 的 角度 看 ,所 谓 数 字 图 像 可 以 理解 为 对 二 维 函 数 fCz,y) 
进行 采样 和 量化 ( 即 离散 处 理 ) 后 得 到 的 图 像 ,因此 ,通常 用 二 维和 矩阵 来 表示 一 幅 数字 图 像 。 
一 幅 图 像 进行 数字 化 的 过 程 就 是 在 计算 机 内 生成 一 个 二 维 矩阵 的 过 程 。 数 字 化 过 程 包括 扫 
描 、\ 采 样 和 量化 三 个 步骤 。 

扫描 (scanning) 是 按照 一 定 的 先后 顺序 对 一 幅 图 像 进行 遍历 的 过 程 , 如 按照 行 优先 的 
顺序 进行 遍历 扫描 ,像素 ( 即 图 像 元 素 ) 是 扫描 (遍历 ) 过 程 中 最 小 的 寻 址 单元 。 对 摄影 图 像 
的 数字 化 就 是 对 胶片 上 一 个 个 征 小 网 格 的 顺序 扫描 。 上 述 网 格 又 称 为 矩形 扫描 网 格 或 光栅 
(Craster) 。 

采样 (sampling) 是 指 遍历 过 程 中 ,在 图 像 的 每 个 像素 位 置 上 测量 其 灰 度 值 , 即 亮 度 值 。 
采样 通常 是 由 光电 传感器 件 完成 , 它 将 每 个 像素 点 的 亮度 转换 成 与 其 成 正比 的 电压 值 ,采样 
的 结果 是 得 到 每 一 像 元 的 灰 度 值 。 

量化 (quantization) 则 是 将 采样 得 到 的 灰 度 值 通过 模 / 数 转换 等 器 件 转换 为 离散 的 整数 
值 。 巾 于 数字 计算 机 只 能 处 理 数 字 量 ,因此 必须 将 连续 的 测量 值 转换 为 离散 的 整数 。 


1.2.4 数字 图 像 获 取 方 法 


数字 图 像 一 般 可 以 通过 以 下 几 种 途径 获取 : 

(1) 图 像 传 感 器 。 图 像 传感器 的 作用 是 将 真实 场景 的 空间 信息 转换 为 图 像 信号 ,以 数 
据 文件 的 形式 保存 在 存储 介质 上 ,并 传输 至 计算 机 , 它 是 图 像 处 理 不 可 或 缺 的 通用 设备 。 例 
如 ,专用 图 像 采 集 卡 通常 还 具有 视频 编辑 功能 ,可 对 数字 化 的 视频 信号 进行 后 期 编辑 处 理 ， 
如 剪 切 画面 ` 添 加 滤 镜 、 字 幕 和 音效 以 及 加 入 各 种 视频 特效 等 。 

(2) 数字 化 扫描 仪 。 扫 描 仪 的 作用 是 将 传统 的 可 见 光 图 像 经 过 数字 化 处 理 转换 为 数字 
图 像 。 例 如 ,将 一 幅 照片 通过 扫描 仪 输入 到 计算 机 中 ,扫描 仪 所 进行 的 过 程 实质 上 就 是 一 个 
数字 化 过 程 。 

(3) 应 用 各 种 光电 转换 设备 直接 得 到 数字 图 像 。 例 如 ,卫星 上 搭载 的 推 需 式 扫描 仪 和 
光 机 扫描 仪 可 以 直接 获取 地 表 甚 至 地 下 物体 的 图 像 并 实时 存 人 存储 器 中 。 此 外 , 侧 视 雷 达 
也 可 以 直接 获取 数字 图 像 。 

(4) 合成 图 像 。 直 接 由 二 维 离散 数学 函数 生成 数字 图 像 。 

无 论 采取 哪 种 获取 方式 ,最 终 得 到 的 数字 图 像 在 数学 上 都 是 一 个 二 维和 矩阵 。 因 此 ,数字 
图 像 处 理 的 实质 是 对 二 维 矩 阵 进 行 各 种 运算 和 处 理 。 也 就 是 说 ,将 原始 图 像 变 为 目标 图 像 
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的 过 程 ,实质 上 是 由 一 个 矩阵 变换 为 另 一 个 矩阵 的 数学 过 程 。 无 论 是 图 像 的 点 运算 、 几 何 运 
算 、 图 像 的 统计 特征 ,还 是 傅 里 叶 等 正 交 变换 ,本 质 上 都 是 基于 图 像 矩 阵 的 数学 运算 。 

因此 ,数字 图 像 处 理 是 指 对 一 个 物体 的 数字 表示 , 即 对 一 个 二 维和 矩阵 施加 一 系列 的 操 
作 , 以 得 到 所 期 望 的 结果 。 


1.2.5 数字 图 像 的 矩阵 表示 


数字 图 像 在 计算 机 中 通常 采用 二 维和 矩阵 表示 和 存储 ,如 图 1-2 所 示 ,形象 地 描述 了 由 一 
幅 数字 图 像 到 该 图 像 所 对 应 的 二 维 矩 阵 的 简易 过 程 和 原理 。 图 1-2(a) 所 示 是 一 幅 大 小 为 
128X128 像素 的 二 维 数字 图 像 ,为 了 表述 方便 ,以 图 1-2(a) 中 取出 的 一 个 小 矩形 方块 为 例 ， 
将 该 小 方块 放大 至 像素 水 平 , 即 图 1-2(b) ,可 以 看 出 这 是 原始 图 像 1-2(a) 中 的 一 个 8X8 像 
素 的 子 图 像 ,放大 后 的 子 图 像 [图 1-2(b)] 的 每 一 像素 点 都 具有 一 个 确定 的 灰 度 值 ,将 这 些 
灰 度 值 按 像素 的 顺序 排列 ,就 是 一 个 二 维和 矩阵 。 和 矩阵 各 元 素 的 值 如 图 1-2(c) 所 示 。 


(a) 原始 图 像 (b) 8X 8 像素 子 图 像 


146 


130 


133 
146 | 146 | 120 | 62 | 
139 | 139 | 139 | 146 | 117 | m2 


117 | 


156 | 158 | 158 | 158 | 158 | 146 
168 | 158 | 156 | 158 | 158 | 158 


139 | 158 | 


(c) 8X8 像 素 子 图 像 的 二 维 矩阵 
图 1-2 ”数字 图 像 的 矩阵 表示 


上 述 由 图 1-2(a) 到 图 1-2(b) 的 过 程 中 ,原始 图 像 在 水 平方 向 和 垂直 方向 被 等 间隔 地 分 
割 成 大 小 相同 的 小 方 格 (grid), 其 中 的 每 一 个 小 方 格 称 为 像素 点 ,简称 为 像素 或 像 元 
(pixel) 。 像 素 是 构成 图 像 的 最 小 基本 单位 ,图 像 的 每 一 像素 都 具有 独立 的 属性 ,其 中 最 基 
本 的 属性 包括 像 元 位 置 和 灰 度 值 两 个 属性 。 位 置 由 像 元 所 在 的 行 和 列 的 坐标 值 决定 ,通常 
以 像素 的 位 置 坐标 (z,y) 表 示 , 像 元 的 灰 度 值 即 该 像素 对 应 的 光学 亮度 值 。 

因此 ,对 一 幅 图 像 按 照 二 维和 矩形 扫描 网 格 进行 扫描 的 结果 是 生成 一 个 与 原 图 像 相对 应 
的 二 维和 矩阵 , 且 和 矩阵 中 的 每 一 个 元 素 都 为 整数 ,矩阵 元 素 (像素 ) 的 位 置 则 由 扫描 的 顺序 决 
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定 , 每 一 个 像素 的 灰 度 值 通过 采样 获取 ,然后 经 过 量化 得 到 每 一 像素 亮度 ( 灰 度 ) 值 的 整数 表 
示 。 因 此 ,一 幅 图 像 经 数字 化 后 所 得 到 的 数字 图 像 ,实际 上 就 是 图 1-2(c) 所 表示 的 一 个 二 维 
整数 矩阵 ,矩阵 的 大 小 由 图 像 像 素 的 多 少 决定 。 


1.3 数字 图 像 处 理 系 统 


计算 机 技术 的 快速 发 展 推动 了 数字 图 像 处 理 技术 的 发 展 , 反 过 来 ,数字 图 像 处 理 技术 的 
广泛 应 用 又 推动 了 计算 机 和 微 电 子 技术 的 发 展 。 图 像 处 理 的 大 数据 量 , 既 推动 了 大 容量 存 
储 器 研发 ,也 推动 和 培育 了 海量 存储 市 场 的 发 展 。 数 字 图 像 的 高 性 能 显示 和 输出 ,促进 了 高 
精度 彩色 显示 器 和 彩色 打印 机 的 诞生 与 发 展 , 并 推动 了 对 扫描 仪 .数码 相机 、 摄 像 机 等 高 精 
度数 字 图 像 输入 设备 的 发 展 。 

数字 图 像 处 理 技术 的 快速 发 展 和 广泛 应 用 推动 了 图 像 处 理 系统 硬件 的 研发 ,不 同行 业 
对 数字 图 像 处 理 系统 的 性 能 提出 了 不 同 的 要 求 。 例 如 ,医学 影像 处 理 系 统 对 系统 的 处 理 速 
度 和 精度 方面 的 要 求 较 高 ,而 指纹 识别 系统 则 要 求 系统 具有 实时 响应 的 性 能 。 虽 然 不 同 的 
图 像 处 理 系统 在 精度 、 速 度 、 容 量 等 方面 的 要 求 可 能 不 尽 相 同 ,但 数字 图 像 处 理 系 统 呈现 出 
专业 化 的 发 展 趋势 。 


1.3.1 数字 图 像 处 理 硬件 系统 


一 个 经 典 的 数字 图 像 处 理 系 统 如 图 1-3 所 示 , 主 要 包括 输入 设备 ,主机 系统 、 输 出 和 存 
储 设备 等 三 部 分 。 


H 1 

! 主机 系统 ! 

和 图 你 处 理 | 
ER 1 1 | 硬件 设备 | | 
| 图 像 输 入 设备 1 | dae 和 
|| 图像 采集 el | 人 图 你 输出 和 存储 设备 | 
| [| 存储 | 一 | 图 像 算法 系统 | 上 | 输出 图 像 | | 图像 | ! 
| | 图 像 合成 人 1 ! | 存储 记录 设备 | ! 
| 中 | 
be dl | 

| | 大 容量 存储 设备 | ! 

图 1-3 ”图像 处 理 系统 的 构成 
1. 图 像 输入 设备 


图 像 输入 设备 包括 图 像 采 集 与 合成 设备 ,以 及 输入 图 像 存储 设备 等 。 随 着 技术 的 发 展 ， 
图 像 输入 设备 的 性 能 越 来 越 高 ,但 价格 却 越 来 越 低 。 常 用 的 输入 设备 主要 包括 图 像 采 集 卡 、 
工业 摄像 机 、 光 电 扫 描 仪 .数字 相机 、 禹 感 和 遥测 等 多 种 设备 类 型 。 

(1) 图 像 采 集 卡 : 图 像 采 集 卡 (image capture card) ,又 称 为 图 像 捕捉 卡 ,是 一 种 可 以 获 
取 数 字 视 频 信 息 , 并 将 其 存储 播放、 传输 到 计算 机 主机 的 硬件 设备 。 采 集 卡 是 进行 图 像 处 
理 必 不 可 少 的 硬件 设备 ,很 多 图 像 采集 卡 能 在 捕捉 视频 信息 的 同时 获得 伴音 ,使 音频 部 分 和 
视频 部 分 在 数字 化 时 同步 保存 .同步 播放 。 
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(2) 光电 扫描 仪 : 包括 平板 式 扫描 仪 和 滚 简 式 扫描 仪 两 种 主要 类 型 。 

(3) 数字 照相 机 : 又 称 为 数码 相机 ,可 以 进行 景物 拍摄 并 以 数字 形式 存储 所 拍摄 的 图 
像 。 数 字 照 相机 的 核心 部 件 是 电荷 耦合 器 件 (CCD) 图 像 传感器 ,目前 主流 型 号 相机 的 分 辩 
率 已 超过 2000 万 像素 ,可 以 通过 USB 接口 与 计算 机 相连 ,将 图 像 数据 传人 计算 机 并 进行 进 
一 步 处 理 。 

(4) 电子 成 像 管 摄像 机 : 电子 成 像 管 摄像 机 的 关键 部 件 是 摄像 器 件 。 摄 像 器 件 将 输入 
的 二 维 物体 信息 ( 即 光 学 图 像 ) 转 换 为 适 于 处 理 和 传输 的 电信 号 。 

(5) 固态 摄像 机 : 包括 CCD 阵列 .电荷 注入 器 件 (CID) 阵 列 和 光电 二 极 管 阵列 三 种 类 
型 ,其 中 CCD 已 得 到 广泛 应 用 ,并 已 逐渐 替代 电子 成 像 管 摄像 机 。 

2. 图 像 算法 系统 

数字 图 像 处 理 的 算法 系统 一 般 由 台式 计算 机 、 笔 记 本 电脑 .服务 器 以 及 其 他 各 种 高 性 能 主 
机 系统 组 成 ,包括 硬件 和 软件 两 大 部 分 。 常 见 的 图 像 处 理 系统 主要 有 计算 机 和 苹果 机 系统 。 

(1) 计算 机 : 计算 机 包括 台式 计算 机 、 笔 记 本 电脑 .服务 器 以 及 其 他 各 种 高 性 能 主机 。 
个 人 计算 机 (PC) 通 常 以 Windows 或 Linux 作为 操作 系统 ,目前 通用 的 图 像 处 理 软 件 一 般 
都 可 以 在 PC 上 运行 。 随 着 微型 机 速度 和 容量 的 提高 ,PC 与 小 型 机 工作 站 的 性 能 差异 已 经 
研 来 越 小 ,包括 ERDAS 和 PCI Works 等 许多 琐 感 图 像 处 理 软件 已 经 可 以 在 PC 上 和 运行。 
随 着 PC 处 理 速度 和 存储 性 能 的 提高 ,许多 大 型 的 专业 化 的 图 像 处 理 系统 也 逐渐 向 PC 上 发 
展 , 但 20 世纪 70 年 代 以 前 ,遥感 图 像 处 理 系统 一 般 只 能 在 工作 站 上 运行 。 

(2) 苹果 机 系统 : 苹果 机 需 使 用 专用 的 操作 系统 软件 ,在 诸如 广告 ,动画 制作 等 领域 主 
要 使 用 苹果 机 等 专业 图 像 处 理 系统 。 在 图 像 处 理 的 早期 ,还 有 各 种 形式 的 图 形 工 作 站 ,如 
Sun、SGI 和 HP 等 公司 生产 的 工作 站 。 工 作 站 一 般 采 用 UNIX 操作 系统 ,适应 于 包括 遥感 
图 像 在 内 的 大 型 图 像 处 理 系统 的 开发 与 应 用 。 现 在 ,由 于 计算 机 运算 速度 的 快速 提升 ,专业 
的 工作 站 已 很 少见 。 

3. 输出 与 存储 

图 像 处 理 系 统 的 输出 设备 主要 有 如 下 三 种 类 型 。 

(1) CRT 显示 器 : 图 像 处 理 系 统 中 应 用 最 广泛 的 输出 设备 是 基于 光栅 扫描 的 阴极 摄像 
管 所 构成 的 CRT 监视 器 。 随 着 技术 的 进步 ,液晶 显示 器 (LCD)、PDP 显示 器 等 输出 设备 也 
开始 得 到 了 广泛 的 应 用 。 

(2) 打印 机 : 显示 器 一 般 用 于 图 像 的 暂时 显示 ,而 打印 机 可 用 于 将 图 像 永久 地 记录 在 
纸 上 。 目 前 常用 的 图 像 打印 设备 主要 包括 彩色 喷 墨 打印 机 和 激光 彩色 打印 机 等 。 

(3) 其 他 设备 : 数字 图 像 还 可 以 通过 一 些 专门 的 记录 设备 将 图 像 记 录 在 胶片 (底片 ) 上 , 然 
后 通过 传统 的 洗 像 技术 或 打印 机 输出 。 大 幅面 的 遥感 卫星 图 像 通常 采用 这 种 输出 形式 。 

由 于 数字 图 像 处 理 系统 数据 量 非常 庞大 ,因此 图 像 处 理 系统 的 存储 设备 一 般 选 用 磁带 、 
光盘 和 大 容量 硬盘 等 存储 器 。 


1.3.2 ”数字 图 像 处 理 软件 系统 


数字 图 像 处 理 系统 不 仅 包含 硬件 设备 ,而 且 需 要 一 定 的 软件 环境 支持 。 以 现 阶段 的 情 
况 看 ,图 像 处 理 软件 平台 一 般 在 Windows 下 开发 ,图 像 软 件 开 发 的 工具 多 种 多 样 ,但 主要 包 
括 以 下 几 种 。 


tt 
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1. MATLAB 图 像 工具 箱 

MATLAB 是 由 MathWorks 公司 推出 的 用 于 数值 计算 的 综合 工具 。 它 具有 强大 的 矩 
阵 运算 和 大 数据 处 理 功 能 ,而 数字 图 像 处 理 与 矩阵 运算 具有 密切 的 联系 ,并 且 MATLAB 图 
像 处 理工 具 箱 提 供 了 丰富 的 图 像 处 理 函数 。 熟 练 使 用 这 些 函数 可 以 完成 几乎 所 有 的 图 像 处 
理工 作 。 不 断 推出 的 MATLAB 新 版 本 其 图 像 处 理 功 能 越 来 越 强大 ,应 用 它 进 行 数字 图 像 
处 理 可 以 节省 大 量 编写 底层 算法 源 代 码 的 时 间 ,避免 程序 设计 中 的 重复 劳动 ,达到 事半功倍 
的 效果 。MATLAB 的 不 足 之 处 是 运行 程序 需要 安装 有 MATLAB 系统 ,应 用 不 方便 ,执行 

2. Visual C++ 开发 系统 

由 于 Visual C++ 是 一 种 具有 强大 综合 软件 开发 能 力 的 系统 ,而 且 所 开发 出 来 的 应 用 程 
序 运行 速度 快 ,并 具有 一 定 的 可 移植 性 能 ,因此 ,Visual C++ 在 数字 图 像 处 理 、 分 析 和 识别 等 
方面 的 应 用 较为 广泛 。 此 外 ,各 国 的 科学 家 和 研究 机 构 开 发 了 不 少 专用 的 图 像 处 理 软件 
环境 。 

3. OpenCV 

OpenCV 的 全 称 是 Open Source Computer Vision Library。OpenCV 于 1999 年 由 
Intel 公司 推出 , 现 由 Willow Garage 提供 支持 。OpenCV 是 一 个 基于 (开源 ) 发 行 的 跨 平台 
的 计算 机 视觉 库 , 可 以 运行 在 Linux、Windows 和 Mac OS 上 。Open 属于 轻 量 级 且 高 效 的 
开发 工具 , 它 由 一 系列 C 函数 和 少量 C++ 类 构成 ,同时 提供 了 Python、Ruby、MATLAB 等 
语言 的 接口 ,实现 了 图 像 处 理 和 计算 机 视觉 方面 的 很 多 通用 算法 。 目 前 较 新 的 版 本 是 2. 4. 
8。 目 前 OpenCV 拥有 包括 500 多 个 C 函数 的 里 平台 的 中 、 高 层 API, 它 不 依赖 其 他 的 外 部 
库 ( 尽 管 也 可 以 使 用 某 些 外 部 库 )。OpenCV 为 Intel Integrated Performance Primitives 
(IPP) 提 供 了 透明 接口 ,这 意味 着 如 果 有 为 特定 处 理 器 优化 的 IPP 库 ,OpenCV 将 在 运行 
时 自动 加 载 这 些 库 。OpenCV 提供 的 视觉 处 理 算法 非常 丰富 ,又 由 C/C++ 开发 ,加 上 其 开 
源 的 特性 ,可 以 无 须 添加 新 的 外 部 支持 就 可 以 完整 地 编译 、 连 接生 成 执行 程序 ,所 以 很 多 
开发 者 用 它 进行 算法 移植 ,OpenCV 的 代码 经 过 适当 改写 可 以 正常 运行 在 DSP 系统 和 单 
片 机 系统 。 

此 外 ,国内 外 的 一 些 研究 机 构 还 推出 了 许多 其 他 数字 图 像 处 理 软件 ,如 AVS 系统 、 
SPIDER 系统 和 IUE 系统 等 。AVS 的 优点 是 具有 对 海量 数据 进行 可 视 化 处 理 的 强大 功能 ， 
在 医学 .图像 显 示 、 资 源 探索 等 方面 得 到 广泛 应 用 。SPIDER 由 日 本 通 产 省 工业 技术 研究 院 
开发 和 推出 ,包含 了 FFT、WHT 等 许多 图 像 处 理 领 域 的 基本 算法 ,受到 了 业界 的 广泛 好 评 。 
IUE 是 美国 .欧洲 ,日 本 共同 开发 的 图 像 处 理 系 统 ,该 系统 具有 严密 的 几何 学 描述 ,可 用 于 
各 种 类 型 的 图 像 处 理 。 


1.4 数字 图 像 处 理 的 应 用 与 发 展 


20 世纪 60 年 代 以 来 ,数字 图 像 处 理 技术 始终 保持 着 迅速 发 展 的 趋势 ,而 且 其 高 速 发 展 
势头 一 直 得 以 延续 ,其 源 动力 表现 在 以 下 几 方面 : 第 一 ,图 像 处 理 所 需 的 计算 机 设备 、 数 字 
化 设备 和 图 像 显示 设备 在 不 断 降 价 , 处 理 器 和 大 容量 存储 器 末端 市 场 价格 逐年 下 降 ,而 性 能 
却 越 来 越 高 ; 第 二 ,与 图 像 处 理 相关 的 基础 科学 研究 快速 发 展 ; 第 三 ,数字 图 像 处 理 的 应 
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领域 持续 扩大 ,并 不 断 涌现 出 新 的 应 用 。 以 美国 和 欧洲 的 工业 化 国家 为 例 , 尽 管 总 军费 开支 
趋 于 平稳 甚至 下 降 , 但 在 “勇气 号 ”和 “机 遇 号 ”火星 探测 器 ,军事 以 及 航天 遥感 等 领域 却 更 多 
地 使 用 了 数字 图 像 处 理 技术 ,而 且 在 商业 智能 ,人工 智能 .生物 医学 ,大 数据 等 领域 对 图 像 技 
术 的 应 用 需求 一 直 持续 增长 。 


1.4.1 数字 图 像 处 理 的 应 用 


图 像 是 人 类 获取 和 交换 信息 的 主要 来 源 , 相 应 地 ,数字 图 像 处 理 的 应 用 领域 也 几乎 涉及 
人 类 生活 .工作 的 方方面面 。 随 着 人 类 活动 范围 的 不 断 扩 大 ,图像 处 理 的 应 用 领域 也 将 随 之 
不 断 扩 大 。 近 年 来 ,数字 图 像 处 理 的 应 用 领域 无 论 深度 上 还 是 广度 上 都 发 生 了 深刻 的 变化 。 
如 表 1-1 所 示 ,图 像 处 理 技 术 已 经 渗透 到 民用 工业 、 军 事 、 航 空 航天 、 医 疗 保健 、 环 境 保护 、 矿 
产 资源 ,工程 技术 ,安全 保卫 和 科研 等 各 领域 ,几乎 涉及 社会 经 济 生活 的 各 方面 ,在 国民 经 济 
中 发 挥 越 来 越 重要 的 作用 。 


表 1-1 图 像 处 理 的 应 用 领域 


应 用 领域 应 用 内 容 

工业 工业 探伤 、 工 件 识别 、 机 器 人 控制 .质量 监测 及 铁路 运输 与 调度 等 
军事 导弹 制导 , 夜 视 瞄准 \ 电 子 沙 盘 、 军 事 侦察 与 训练 .军事 演习 等 
航空 航天 航天 发 射 , 空 间 站 建设 与 维护 、 陆 地 卫星 ,星际 探测 与 研究 等 
经 济 身份 认证 ,指纹 技术 虹膜 识 别 \ 防 伪 、 网 络 购物 等 
通信 传真 ,视频 、 多 媒体 通信 、GIS、 视 频 会 议 等 
气象 与 环保 卫星 云图 分 析 、 天 气 预报 \ 水 环境 监测 ,大气 污 染 监 测 与 调查 等 
水 利 河流 分 布 洪 水 监测 \ 水 下 泥 沙 监测 与 预测 、 水 利 及 水 害 调查 等 
生物 医学 工程 X 射 线 照片 分 析 、CT ,核磁 成 像 分 析 、 细 胞 分 析 、 染 色 体 分 类 等 
法 律 视频 监控 ,生物 特征 识别 ,指纹 识别 等 
物理 、 化 学 结晶 分 析 、 谱 分 析 等 
地 质 地 图 绘制 .矿产 监测 ,油气 资源 勘探 等 
海洋 海岸 线 监测 ,海洋 污染 监测 \, 鱼 群 探查 \ 海 洋 安全 监测 等 
农林 植被 分 布 调查 农作物 估 产 \、 病 虫害 监测 、 森 林 火 灾 监 测 等 

1. 航空 航天 


数字 图 像 处 理 技术 在 航空 航天 领域 的 应 用 非常 广泛 ,除了 JPL 对 月 球 、 火 星 照片 的 处 
理 之 外 ,还 包括 很 多 方面 ,如 20 世纪 60 年 代 末 以 来 ,美国 及 一 些 国际 组 织 发 射 了 数量 可 观 
的 资源 遥感 卫星 (如 LANDSAT 系列 ) 和 天 空 实验 室 ( 如 SKYLAB), 由 于 成 像 条 件 受 飞行 
器 位 置 ,姿态 .环境 条 件 等 影响 ,图 像 质量 不 是 很 高 ,而 必须 采用 数字 图 像 处理 技 术 。 如 
LANDSAT 系列 陆地 卫星 ,采用 多 波段 扫描 器 (MSS) ,在 900km 高 空 对 地 球 每 一 区 域 以 18 
天 为 一 周期 进行 扫描 成 像 ,其 图 像 地 面 分 辨 率 相当 于 十 几米 数量 级 (1983 年 LANDSAT-4 
分 辨 率 为 30m) 。 这 些 图 像 在 空中 先 处 理 ( 数 字 化 ,编码 ) 成 数字 信号 存 人 存储 系统 中 ,在 卫 
星 经 过 地 面 站 上 空 时 ,再 高 速 传送 至 地 面 中 心 ,然后 由 处 理 中 心 分 析 判 读 。 这 些 图 像 无 论 在 
成 像 .存储 、 传 输 过 程 中 ,还 是 在 判读 分 析 中 ,都 必须 应 用 数字 图 像 处 理 技术 。 在 我 国 , 无 论 
是 “神舟 "系列 (1 一 10 号 )“ 天 宫 ” 系 列 “ 天 舟 ” 系 列 、 绕 月 飞船 系列 的 发 射 ,还 是 “空间 站 ”的 
建立 ,以 及 各 型 号 的 运载 火箭 和 飞船 的 历次 发 射 、 状 态 监 控 、 故 障 修复 及 回收 ,这 其 中 数字 图 
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像 处 理 技术 也 都 发 挥 了 不 可 替代 的 重要 作用 。 

此 外 ,包括 航空 遥感 .卫星 琐 感 .空间 探测 .军事 侦察 等 诸多 领域 都 离 不 开 图 像 处理 技 
术 。 很 多 国家 每 天 派出 一 定数 量 的 侦察 机 对 地 球 上 感 兴趣 的 地 区 进行 大 量 的 观察 和 信息 传 
输 , 获 取 军 事 和 经 济 等 方面 的 有 用 信息 。 现 在 ,世界 各 国 在 进行 资源 调查 (如 森林 调查 ,海洋 
泥 沙 和 渔业 调查 ,水 资源 调查 等 ) ,灾害 勘测 (如 病虫害 检测 水 火 检测 、 环 境 污染 检测 等 ) , 资 
源 勘 察 ( 如 石油 勘探 、 矿 产量 探测 、 大 型 工程 地 理 位 置 勘 探 分 析 等 ), 城 市 规划 (如 地 质 结构 、 
水 源 及 环境 分 析 等 ) ,农业 规划 (如 土壤 营养 .水 分 和 农作物 生长 .产量 的 估算 等 ) 都 大 量 采 
了 图 像 处 理 技术 。 十 几 年 来 ,我国 也 陆续 开展 了 上 述 多 方面 的 一 些 实际 应 用 ,并 获得 了 很 好 
的 效果 ,在 航空 航天 和 太空 星际 研究 方面 ,图 像 处 理 技术 也 发 挥 了 相当 大 的 作 

2. 工业 应 用 

工业 应 用 是 数字 图 像 处 理 技术 的 重要 应 用 领域 之 一 。 从 20 世纪 60 年 代 开 始 ,在 美国 、 
日 本 及 欧洲 的 一 些 工 业 化 国家 就 已 经 开始 采用 数字 图 像 处 理 技术 进行 工业 生产 的 质量 控 
制 。 例 如 ,在 现代 化 的 流水 生产 线 上 ,可 以 利用 图 像 处 理 技术 对 产品 和 部 件 进行 无 损 检测 ; 
在 浮 法 玻璃 生产 线 上 ,可 以 对 玻璃 质量 进行 监控 和 筛选 等 。 

在 工业 和 工程 领域 中 ,图 像 处 理 技术 有 着 广泛 的 应 用 ,如 在 自动 装配 线 上 检测 零件 的 质 
量 及 对 零件 进行 分 类 , 印 制 电 路 板 疯 病 检查 ,弹性 力学 照片 的 应 力 分 析 , 流 体力 学 图 片 的 阻 
力 和 升力 分 析 ,邮政 信件 的 自动 分 拣 ,在 一 些 有 毒 、 放 射 性 环境 内 识别 工件 及 物体 的 形状 和 
排列 状态 ,先进 的 设计 和 制造 技术 中 采用 工业 视觉 等 。 其 中 值得 一 提 的 是 ,研制 具备 视觉 、 
听觉 和 触觉 功能 的 智能 机 器 人 将 会 给 工农 业 生 产 带 来 新 的 激励 ,目前 已 在 工业 生产 中 的 喷 
漆 .焊接 、 装 配 中 得 到 有 效 的 利用 。 

3. 医学 与 生物 工程 

由 于 数字 图 像 处 理 技 术 具 有 直观 无 创伤 ,经济 和 安全 方便 等 诸多 优点 ,因此 图 像 处 理 
在 医学 领域 的 应 用 非常 广泛 。 从 近 30 年 来 国内 外 医学 领域 的 发 展 情况 看 ,图 像 处 理 技术 已 
在 临床 诊断 .病理 研究 等 医学 领域 发 挥 了 重要 作用 ,不 仅 应 用 领域 日 益 广泛 ,而 且 很 有 成 效 。 

除了 已 经 提 到 的 获 诺 贝尔 奖 的 CT 之 外 ,图 像 处 理 技术 在 医学 和 生物 医学 工程 领域 的 
应 用 非常 之 多 。 如 医用 显 微 图像 的 处 理 分 析 ( 红 /白细胞 分 类 与 计数 、 染 色 体 分 析 、 癌 细胞 识 
别 等 ) ,目前 广泛 应 用 于 临床 诊断 和 治疗 的 各 种 成 像 技术 ,如 X 光 肺 部 图 像 增强 、 超 声波 图 
像 处 理 , 心 电 图 分 析 立体 定向 放射 治疗 等 方面 都 广泛 应 用 了 图 像 处 理 技术 。 

在 CT 推出 后 ,目前 类 似 的 设备 已 有 多 种 ,如 核磁 共振 (nuclear magnetic resonance 
imaging,NMRI) 、 电 阻抗 断层 图 像 技 术 (electrical impedance tomography, EIT) 和 阻抗 成 像 
(impedance imaging) ,这 些 都 是 利用 人 体 组 织 的 电 特 性 (阻抗 、 导 纳 、 介 电 常 数 ) 形 成 人 体内 
部 图 像 的 技术 。 由 于 不 同 组 织 和 器 官 具有 不 同 的 电 特 性 ,因此 这 些 电 特性 包含 了 解剖 学 信 
息 。 更 重要 的 是 人 体 组 织 的 电 特 性 随 器 官 功能 的 状态 而 变化 ,因此 EIT 可 望 绘 出 反映 与 人 
体 病理 和 生理 状态 相应 功能 的 图 像 。 目 前 ,EIT 的 一 些 算法 正在 呼吸 系统 、 消 化 系统 ,心血 
管 系统 等 方面 进行 临床 应 用 的 探索 。 

4. 通信 和 领域 

早 在 1865 年 ,法 国 在 巴黎 至 里 昂 就 成 功 试验 了 传真 通信 ,虽然 由 于 技术 及 经 济 原因 , 当 
时 的 图 像 通信 技术 发 展 一 直 非 常 缓慢 ,但 开创 了 人 类 影像 通信 的 先河 。 按 业务 性 能 划分 ,图 
像 通信 可 分 为 电视 广播 (点 对 面 通信 ) 传真、 可 视 电 话 ( 点 对 点 通信 和) 会 议 电视 ( 单 点 对 多 
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点 ) 、 图 文 电视 、 可 视图 文 以 及 电缆 电视 等 。 

当前 通信 的 主要 发 展 方向 是 声音 文字、 图 像 和 数据 结合 的 多 媒体 通信 。 上 有 具体 地 讲 是 将 
电话 .电视 和 计算 机 以 三 网 合 一 的 方式 在 数字 通信 网 上 传输 。 其 中 以 图 像 通信 最 为 复杂 和 
困难 , 因 图 像 的 数据 量 十 分 巨大 ,如 传送 彩色 电视 信号 的 速率 达 100Mb/s 以 上 。 要 将 这 样 
高 速率 的 数据 实时 传送 出 去 ,必须 采用 编码 技术 来 压缩 信息 的 比特 量 。 在 一 定 意义 上 讲 , 编 
码 压 缩 是 这 些 技术 成 败 的 关键 。 除 了 已 应 用 较 广泛 的 炉 编 码 .DPCM 编码 、 变 换 编码 外 , 国 
内 外 正在 大 力 开 发 研究 新 的 编码 方法 ,如 分 行 编码 、 自 适应 网 络 编码 、 小 波 变换 图 像 压缩 编 
码 等 。 

20 世纪 70 年 代 , 由 于 微 电 子 技术 的 突破 和 大 规模 集成 电路 的 发 展 ,解决 了 图 像 通信 中 
的 关键 技术 ,有 效 推动 了 图 像 通信 的 应 用 与 发 展 ,从 此 图 像 通信 和 逐渐 成 为 了 人 们 生活 中 常 月 
的 通信 方式 。1980 年 CCITT 为 三 类 传真 机 和 公共 电话 交换 网 上 工作 的 数字 传真 建立 了 国 
际 标准 ,1984 年 CCITT 提出 了 ISDN 标准 ,以 及 当今 基于 IP 的 多 媒体 通信 都 意味 着 非 语 
音 通信 业务 在 通信 中 所 占据 的 重要 位 置 。 图 像 通信 主要 包括 如 下 几 种 方式 : 

(1) 传真 。 传 真 指 将 文字 图表、 照片 等 静止 图 像 通过 光电 扫描 的 方式 变 成 电信 号 加 以 传 
送 的 设备 。CCITT 于 1980 年 颁布 了 三 类 数字 传真 国际 标准 : 一 类 机 不 进行 压缩 ,4 线 /毫米 ， 
传送 一 页 A4 文件 需 6 分钟 ; 二 类 机 采用 了 频带 压缩 技术 (残留 边 带 传输 ) ,4 线 / 毫 米 , 传 送 
一 页 A4 文件 需 3 分 钟 ; 三 类 机 在 传送 前 采用 了 去 宛 余 技术 ,在 电话 线 上 传送 一 页 A4 文件 
需 1 分 钟 。 四 类 机 是 在 三 类 机 的 基础 上 发 展 起 来 的 传真 设备 ,采用 了 去 完 余 、 纠 错 码 技术 ， 
连接 Modem 以 后 可 以 在 公用 电话 网 上 使 用 。 经 过 多 年 发 展 , 传 真 技术 不 断 进步 ,目前 的 分 
辩 率 可 达 16 点 /毫米 以 上 ,传送 一 幅 A4 文件 仅 需 数 秒 。 

(2) 电视 广播 。1925 年 英国 实现 了 单 色 电视 广播 ,1936 年 英国 BBC 正式 开始 推出 电 
视 广播 。 目 前 彩色 电视 主要 有 三 种 制式 , 即 美国 .日 本 等 国 所 采用 的 NTSC 制式 ,中 国 和 西 
欧 、 非 洲 等 地 区 所 采用 的 PAL 制式 ,以 及 法 国 、 俄 罗斯 等 国 所 采用 的 SECAM 制式 。 

(3) 图 文 电视 和 可 视图 文 。 图 文 电视 (teletext) 和 可 视图 文 (videotext) 是 提供 可 视图 形 
文字 信息 的 通信 方式 。 图 文 电视 是 单 向 传送 信息 ,是 在 电视 信号 消 隐 期 发 送 图 文 信息 ,用 户 
可 用 电视 机 和 专用 终端 收看 该 信息 。 可 视图 文 是 基于 双向 工作 方式 的 ,用 户 可 用 电话 向 信 
息 中 心 提出 服务 内 容 或 从 数据 库 中 选择 信息 。 

(4) 有 线 电视 。 有 线 电 视 即 CATYV, 它 是 采用 电缆 或 光线 传送 电视 节目 的 电视 技术 。 
1949 年 ,美国 安装 了 全 球 第 一 个 有 线 电视 系统 ,1977 年 采用 光缆 实现 了 有 线 电视 。 随 后 ,有 
线 电 视 系 统 由 于 其 信号 稳定 性 、 信 号 质量 和 频道 数量 等 方面 的 特点 在 全 球 得 到 迅速 普及 。 

(5) 可 视 电 话 和 会 议 电 视 。 自 从 1964 年 美国 国际 博览 会 首次 展 出 了 带宽 为 1MHz 的 
picture-phone MOD-I 可 视 电 话 系统 以 来 ,可 视 电话 和 会 议 电视 系统 由 于 其 具有 方便 和 高 效 
等 特点 而 得 到 广泛 应 用 。 目 前 ,可 视 电 话 和 会 议 电视 均 采用 数字 压缩 技术 ,并 采用 H. 261、 
H. 263、H. 230、H. 323 等 相关 图 像 编 码 和 会 议 电视 国际 标准 。 

5. 遥感 

1962 年 国际 上 才 开 始 正式 使 用 遥感 (remote sensing) 一 词 。 可 以 说 数字 信号 处 理 技术 
对 琐 感 遥测 技术 的 发 展 与 推动 起 了 非常 重要 的 作用 ,还 感 技术 发 展 的 重要 事件 无 不 与 数字 
图 像 处 理 技术 密切 相关 。1909 年 意大利 人 乘 飞 机 拍摄 世界 上 第 一 张 航空 照片 .1957 年 苏联 
和 1958 年 美国 发 射 的 第 一 颗 人 造 地 球 卫星 都 采用 了 大 量 的 数字 图 像 处 理 技 术 。 此 后 ,美国 
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相继 发 射 多 颗 陆 地 资源 探测 下 卫星 。 

在 航空 遥感 和 卫星 遥感 技术 中 , 某 些 军 事 大 国 每 天 派出 很 多 侦察 飞机 对 地 球 上 的 敏感 
地 区 进行 大 量 的 空中 拍摄 ,对 拍摄 的 照片 进行 处 理 分 析 , 以 前 需要 雇用 几 千 人 ,而 现在 改 
配备 有 高 级 计算 机 的 图 像 处 理 系 统 来 判读 分 析 , 既 节省 了 人 力 , 又 加 快 了 速度 ,还 可 以 从 照 
片 中 提取 人 工 所 不 能 发 现 的 大 量 有 用 情报 。1982 年 ,美国 基于 LANDSAT-N 卫星 成 功 组 
网 定位 精度 达到 士 10m 级 的 全 球 定位 系统 (global positioning system,GPS) 。 

2017 年 11 月 5 日 ,中 国 第 三 代 导航 卫星 顺利 升 空 ,标志 着 我 国正 式 建成 北斗 全 球 卫星 
导航 系统 (BeiDou navigation satellite system,BDS) 。 这 是 我 国 自行 研制 的 全 球 卫星 导航 系 
统 , 是 继 美国 GPS、 俄 罗斯 格 洛 纳 斯 卫星 导航 系统 (GLONASS) 之 后 第 三 个 成 熟 的 卫星 导航 
系统 。 北 斗 全 球 卫星 导航 系统 由 空间 段 ` 地 面 段 和 用 户 段 三 部 分 组 成 ,可 在 全 球 范围 内 全 天 
候 、 全 天 时 为 各 类 用 户 提供 高 精度 ,高 可 靠 定 位 .导航 、 授 时 服务 ,并 具有 短 报 文通 信 能 力 ,已 
经 具备 区 域 导航 、 定 位 和 授时 能 力 , 定 位 精度 小 于 10m, 测 速 精度 为 0. 2m/s, 授 时 精度 为 
l0ns。 未 来 ,基于 图 像 处 理 技术 的 遥感 遥测 技术 效率 及 分 状 率 越 来 越 高 ,应 用 越 来 越 普 及 和 
深入 ,在 土地 测绘 资源 勘探 \、 军 事 侦察 ,气象 监测 与 预报 、 林 业 资源 勘测 、 环 境 污 染 监 测 、 农 
作物 估 产 等 方面 将 得 到 更 广泛 的 应 用 。 

6. 安全 与 交通 

目前 ,在 安全 领域 已 开始 采用 图 像 处 理 技术 与 模式 识别 等 方法 实现 重要 场所 、 特 定 现场 
和 敏感 地 点 的 监控 ,可 以 通过 采用 足迹 .指纹 识别 \ 人 脸 识别 .虹膜 识别 等 技术 实现 案件 侦 
破 , 通 过 数字 图 像 技 术 和 通信 技术 实现 对 交通 的 管理 与 调度 等 。 

7. 军事 和 公安 

在 军事 方面 图 像 处 理 和 识别 主要 用 于 : 导弹 的 精确 末 制 导 ; 各 种 侦察 照片 的 判读 ; 具 
有 图 像 传输 ,存储 和 显示 的 军事 自动 化 指挥 系统 ,飞机 .坦克 和 军舰 模拟 训练 系统 等 ; 公安 
业务 图 片 的 判读 分 析 ,指纹 识别 ,人 脸 鉴别 ,不 完整 图 片 的 复原 ,以 及 交通 监控 .事故 分 析 等 。 
目前 已 投入 运行 的 高 速 公路 不 停车 自动 收费 系统 中 的 车 辆 和 车 牌 的 自动 识别 都 是 图 像 处 理 
技术 成 功 应 用 的 例子 。 

8. 金融 与 支付 

21 世纪 是 信息 化 时 代 , 基 于 互联 网 ,电子 商务 在线 购 物 的 应 用 日 益 普及 ,金融 与 电子 
支付 已 广泛 使 用 指纹 密码 ,在线 身份 认证 、 产 品 防伪 、 数 字 证 书 、 人 脸 识别 甚至 虹膜 识别 等 技 
术 , 这 些 无 不 与 图 像 处 理 技 术 密 切 相 关 。 

9. 视频 和 多 媒体 

目前 ,视频 和 多 媒体 系统 已 广泛 应 用 于 电影 与 电视 制作 中 ,许多 电视 制作 人 员 都 能 熟练 
使 用 图 像 处 理 、 变 形 、 合 成 等 技术 制作 各 种 特技 动作 。 多 媒体 系统 离 不 开 静 止 图 像 和 动态 图 
像 的 采集 、 压 缩 、 处 理 、 存 储 和 传输 。 

图 像 处 理 技术 的 应 用 领域 已 非常 广泛 , 它 在 社会 经 济 发 展 .国计民生 、 国 防 与 国家 安全 
以 及 日 常生 活 中 发 挥 着 越 来 越 重 要 的 作用 。 


1.4.2 数字 图 像 处理 的 发 展 


始 于 20 世纪 60 年 代 现代 数字 图 像 处 理 技术 , 随 着 微 电 子 技术 发 展 . 计 算 机 运算 和 人 处理 
速度 的 提升 .各 种 快速 算法 的 出 现 , 已 经 从 最 初 的 航天 探测 等 少数 尖端 领域 向 现代 文明 的 各 
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个 方向 渗透 ,图 像 处 理 技术 将 向 高 速 、 高 分 辨 率 、 多 媒体 、 智 能 及 标准 化 方向 发 展 ,主要 表现 
在 以 下 几 个 方面 。 

1. 高 速 .高 分 辨 率 和 高 精度 

数字 图 像 处 理 技术 在 进一步 加 强 理论 研究 ,逐步 形成 图 像 处 理学 科 体 系 的 同时 ,应 进 一 
步 提 高 硬件 速度 ,这 不 仅 要 提高 计算 机 的 速度 ,以 及 A/D 和 D/A 的 速度 和 精度 ; 而 且 应 该 
提高 分 辨 率 , 主 要 包括 采集 分 辨 率 和 显示 分 辨 率 ,着 重 解决 图 像 处 理 速度 等 核心 问题 ,将 图 
像 ,图形 技 术 相 结合 , 朝 着 三 维 成 像 或 多 维 成 像 的 方向 发 展 。 例 如 ,在 航天 遥感 ` 气 象 预报 的 
云图 处 理 方面 ,巨大 的 数据 量 和 处 理 速度 仍然 是 主要 矛盾 之 一 。 

2. 新 理论 与 新 算法 

近年 来 ,数字 图 像 处 理 领域 在 理论 上 也 有 了 更 新 的 发 展 ,新 的 理论 和 新 的 算法 不 断 涌 
现 , 如 Wavelet 算法 ,Morphology 算法 、Fractal 算法 、 分 形 几 何 (Fractal) 、 数 学 形态 学 神经 
网 络 算法 .遗传 算法 . 卷 积 神经 网 络 等 。 其 中 Fractal 算法 广泛 用 于 图 像 处 理 、 图 形 处 理 、 纹 
理 分 析 , 同 时 还 可 以 用 于 数学 ,物理 ,生物 、 神 经 和 音乐 等 方面 ,这 些 理论 及 建立 在 其 上 的 算 
法 ,将 会 成 为 今后 图 像 处 理 理论 与 技术 的 研究 热点 ,并 将 进一步 推动 图 像 处 理 技术 的 发 展 。 
此 外 ,图 像 处 理 技 术 将 加 强 新 算法 的 研究 与 加 强 软 件 研究 相 结 合 , 开 发 新 的 处 理 方法 ,特别 
要 注意 移植 和 借鉴 其 他 学 科 的 技术 和 研究 成 果 , 创 造 新 的 处 理 方法 。 

3. 与 通信 技术 结合 

数字 图 像 处 理 技术 在 理论 .软件 、 硬 件 技术 不 断 发 展 的 同时 ,其 另 一 个 新 的 发 展 方向 是 
图 像 与 通信 技术 的 紧密 结合 。 从 1865 年 的 传真 通信 开始 ,到 目前 正 开 始 进入 应 用 的 可 视 电 
话 , 图 像 处 理 与 通信 技术 的 结合 已 经 历 了 一 百 多 年 的 历程 。 随 着 微 电 子 技术 、 计 算 机 技术 ， 
特别 是 VLSI 制造 技术 .通信 数字 化 技术 的 迅速 发 展 , 图 像 与 通信 技术 日 益 融 合 。 会 议 电 
视 、 电 视 电 话 、 图 文 电视 、 可 视图 文 .传真 等 图 像 通信 方式 已 应 用 到 各 行 各 业 。20 世纪 90 年 
代 初 ,以 H. 261( 活 动 图 像 编码 国际 标准 ) 以 及 随后 一 系列 图 像 编 码 、 图 像 通 信 的 国际 标准 
先后 获得 通过 为 标志 ,解决 了 可 视 技术 在 通信 中 的 应 用 这 一 长 期 困扰 人 们 的 问题 , 极 大 地 推 
动 了 会 议 电视 .电视 电话 等 图 像 通信 方式 的 国际 化 和 产业 化 ,图 像 通信 开始 进入 一 个 高 速 发 
展 的 新 阶段 。 

4. 图 像 处 理 的 硬件 技术 

在 图 像 处 理 技术 方面 ,一 个 新 的 趋势 是 更 加 重视 图 像 处 理 的 专门 硬件 芯片 的 研究 ,把 图 
像 处 理 的 众多 功能 固化 在 芯片 上 ,使 之 更 加 便于 应 用 。 围 绕 HDTV( 高 清晰 度 电视 的 研 
制 ,开展 实时 图 像 处 理 的 理论 及 技术 研究 ,向 着 高 速 .高 分 辩 率 .立体 化 、 多 媒体 化 .智能 化 和 
标准 化 方向 发 展 。20 世纪 80 年 代 后 期 开始 ,图 像 处 理 的 硬件 技术 也 得 到 了 迅速 发 展 ,这 时 
不 仅 能 处 理 二 维 图 像 ,而 且 开 始 进行 三 维 图 像 的 处 理 。 目 前 ,一 些 图 像 处 理 硬件 采用 流水 线 
结构 ,可 以 将 JPEG 集成 到 一 个 芯片 上 。 进 入 21 世纪 以 来 .图像 处 理 技术 已 逐步 渗透 到 人 
类 生活 和 社会 发 展 的 各 个 方面 。 例 如 近年 来 鞍 勃 发 展 的 医学 图 像 处 理 、 多 媒体 信息 处 理 技 
术 、 图 像 融 合 技术 、 虚 拟 现实 技术 等 ,图 像 在 其 中 均 占据 了 主要 地 位 ,文本 、 图 形 、 动 画 、 视 频 
都 要 借助 于 图 像 处 理 技 术 才 能 充分 发 挥 它们 的 作用 。 

5. 图 像 处 理 领域 的 标准 化 
图 像 的 信息 量 大 数据 量 大 ,因而 图 像 信息 的 建 库 、 检 索 和 交流 是 一 个 重要 的 问题 。 就 
现 有 的 情况 看 ,软件 与 硬件 种 类 繁多 ,交流 和 使 用 极为 不 便 , 成 为 资源 共享 的 严重 障碍 。 应 
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建立 图 像 信 息 库 ,统一 存放 格式 ,建立 标准 ,统一 检索 方法 。 此 外 ,还 应 加 强 边 缘 学 科 的 研究 
工作 ,促进 图 像 处 理 技术 的 发 展 。 如 人 的 视觉 特性 ,心理 学 特性 等 方面 的 研究 ,如 果 有 所 突 
破 ,将 对 图 像 处 理 技术 的 发 展 起 到 极 大 的 促进 作用 。 

6. 新 的 应 用 领域 

从 JPL 实验 室 开拓 性 地 引入 数字 图 像 处理 技 术 到 我 国 北斗 全 球 卫 星 导 航 系统 以 及 空 
间 站 的 建立 ,都 标志 着 数字 图 像 处 理 技术 为 人 类 的 航空 航天 及 军事 等 尖端 领域 做 出 了 持续 
的 贡献 ,与 此 同时 ,美国 .日 本 和 欧洲 一 些 国家 的 科技 人 员 又 将 图 像 处 理 技术 从 空间 技术 推 
广 到 了 生物 学 .医学 .光学 .陆地 卫星 ,多 波段 遥感 图 像 分 析 . 人 工 智 能 .粒子 物理 ,地质 勘 探 、 
工业 检测 及 印刷 等 多 种 应 用 领域 。 特 别 是 进入 21 世纪 以 来 ,关于 图 像 处 理 方面 的 研究 论 
著 , 在 质量 和 数量 上 都 在 迅速 攀升 ,技术 上 的 突破 不 断 促进 数字 图 像 处 理 技术 向 深度 和 广度 
发 展 ,图 像 水 印 图像 检 索 等 各 种 新 的 应 用 方向 不 断 出 现 。 

数字 图 像 处 理 理论 和 技术 经 过 了 约 50 年 的 快速 发 展 ,已 不 再 局 限于 航空 .航天 、 通 信和 
医学 等 少数 尖端 领域 ,已 迅速 发 展 成 一 门 独立 的 具有 强大 生命 力 的 学 科 ,并 渗透 到 了 科学 研 
究 的 各 个 领域 .工业 生产 的 众多 行业 、 人 类 生活 的 各 个 方面 。 随 着 各 种 应 用 需求 的 不 断 增 
加 ,数字 图 像 处 理 无 论 在 理论 上 还 是 实践 上 都 存在 着 巨大 的 潜力 ,可 以 预料 ,数字 图 像 处 理 
技术 必 将 更 加 迅速 地 向 广度 和 深度 发 展 。 今 天 , 随 着 科技 事业 的 进步 以 及 人 类 需求 的 多 样 
化 ,多 学 科 的 交叉 融合 已 是 现代 科学 发 展 的 突出 特色 和 必然 途径 ,而 图 像 处 理学 科 是 一 门 既 
与 尖端 科学 紧密 相连 ,又 与 国计民生 密切 相关 的 应 用 科学 , 必 将 产生 更 多 的 应 用 领域 和 更 新 
的 成 果 。 


习题 


1. 什么 是 图 像 ? 图 像 与 数字 图 像 有 何 区别 ? 

2. 简要 分 析 为 什么 在 计算 机 系统 中 以 二 维和 矩阵 表示 数字 图 像 。 

3. 什么 是 物理 图 像 ? 物理 图 像 包括 哪 几 种 类 型 ? 

4. 什么 是 数字 图 像 ? 在 计算 机 中 ,数字 图 像 如 何 表示 和 存储 ? 

5. 在 升学 和 工作 的 常规 体检 中 ,经 常 要 进行 X 射线 照片 和 胸 透 等 方面 的 检查 ,分析 这 
些 医学 成 像 设备 采用 了 哪些 数字 成 像 技 术 , 这 些 技术 对 医学 检查 和 诊断 具有 哪些 作用 。 

6. 某 个 图 形 工作 环境 使 用 32X32 像素 的 图 像 作为 图 标 (icon) ,每 个 像素 具有 16 种 颜 
色 ,总 共 可 产生 多 少 种 不 同 的 图 标 ? 

7. 若 某 一 大 小 为 200X200 像素 的 图 像 ,每 个 像素 的 灰 度 有 40 级 ,假设 每 1 亿 个 可 能 
图 像 中 仅 有 1 个 是 可 识别 的 ,观看 每 一 幅 图 像 需 用 时 1s ,那么 看 完全 部 图 像 需 多 长 时 间 ? 

8. 图 像 处 理 系统 通常 包含 哪些 部 分 ? 各 部 分 有 何 作用 ? 

9. 应 用 MATLAB 开发 数字 图 像 系统 具有 哪些 优点 ? 

10. 数字 图 像 处 理 技 术 的 发 展 方向 主要 包括 哪些 方面 ? 
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CHAPTER 2 


日 常生 活 中 ,人 们 睁 开眼 上 晴 就 可 以 看 到 各 种 各 样 的 图 像 ,这 些 图 像 包 罗 万 象 , 既 包 括 各 
种 海报 ,平面 杂志 图 片 . 报 刊 图 片 等 模拟 图 像 , 也 包括 计算 机 网 络 、 电 子 文档 中 的 数字 图 像 。 
对 于 数字 图 像 ,还 可 按 图 像 类 型 和 格式 类 型 进行 进一步 划分 。 众 所 周知 ,计算 机 只 能 处 理 数 
字 信 息 , 因 此 数字 图 像 处 理 首先 需 将 模拟 图 像 转 换 为 以 数字 形式 表示 和 储存 的 数字 图 像 , 同 
时 ,对 于 数字 图 像 ,根据 科学 研究 、 工 业 生产 和 日 常 其 他 需要 ,有 时 还 需要 对 数字 图 像 进 行 质 
量 评价 或 其 他 统计 评价 。 

本 章 主 要 对 数字 图 像 的 类 型 .图像 数字 化 器 .图 像 数 字 化 中 的 采样 和 量化 原理 、 像 素 间 
的 基本 关系 、 常 用 图 像 文 件 格式 .图 像 的 显示 与 打印 .图 像 质 量 评价 方法 、. 灰 度 直方 图 以 及 数 
字 图 像 的 统计 特征 等 方面 进行 了 分 析 和 讨论 。 


2.1 数字 图 像 的 类 型 


在 计算 机 中 ,为 方便 对 数字 图 像 进 行 处 理 ,静态 数字 图 像 根据 其 特性 可 以 分 为 矢量 
(vector) 图 和 位 图 (bitmap) ,位 图 也 称 为 栅 格 图 像 。 

矢量 图 是 采用 一 系列 绘图 指令 来 表示 一 幅 图 .这 种 方法 的 本 质 是 以 数学 和 几何 学 中 的 
公式 描述 一 幅 图 像 ,图 像 中 每 一 个 形状 都 是 一 个 完整 的 公式 , 称 为 一 个 对 象 。 对 象 是 一 个 封 
闭 的 整体 ,所 以 定义 图 像 上 对 象 的 变化 以 及 与 其 他 对 象 的 关系 对 计算 机 来 说 是 简单 的 ,所 有 
这 些 变化 都 不 会 影响 到 图 像 中 的 其 他 对 象 。 数 学 形式 的 矢量 图 文件 具有 两 个 显著 的 优点 : 
数据 量 很 小 ; 图 像 质 量 与 分 辩 率 无 关 。 无 论 将 矢量 图 像 放 大 或 缩小 多 少 次 ,图 像 总 是 以 显 
示 设 备 允 许 的 最 大 清晰 度 显 示 ,在 计算 机 计算 与 显示 一 幅 图 像 时 ,也 往往 能 看 到 画图 的 过 
程 。 但 矢量 图 也 具有 明显 的 缺点 , 即 不 易 制 作 色调 丰富 或 色彩 变化 太 多 的 图 像 ,而 且 绘 出 来 
的 图 像 逼 真 度 差 ,也 不 易 在 不 同 的 软件 间 交 换文 件 。 

位 图 是 计算 机 表示 数字 图 像 最 常用 的 一 种 类 型 。 根 据 颜 色 和 灰 度 级 数量 ,可 以 将 位 图 
分 为 二 值 图 像 . 灰 度 图 像 .索引 图 像 和 RGB 彩色 图 像 四 种 基本 类 型 。 目 前 ,大 多 数 图 像 处 理 
软件 都 支持 这 四 种 类 型 的 图 像 。 

1. 二 值 图 像 

二 值 图 像 的 灰 度 值 只 有 0、1, 其 中 灰 度 值 0 代表 黑色 ,1 代表 白色 。 因 此 ,二 值 图 像 所 对 
应 的 二 维 矩阵 元 素 也 由 0、1 构成 。 由 于 每 一 像素 (矩阵 中 每 一 元 素 ) 的 取 值 只 有 0、1 两 种 ， 
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所 以 计算 机 中 二 值 图 像 的 数据 类 型 采用 一 个 二 进 制 位 表示 。 采 用 扫描 仪 扫描 图 像 时 , 若 设 


管 为 LineArt 格式 , 则 扫描 仪 以 一 位 颜色 模式 来 看 待 图 像 。 若 采样 点 颜色 为 黑 , 则 扫描 仪 将 
相应 的 像素 位 元 置 为 0, 否则 置 为 1。 二 值 图 像 通常 用 于 文字 、 线 条 图 的 扫描 识别 (OCR) 和 
掩 膜 图 像 的 存储 。 


二 值 图 像 又 称 为 线 画 稿 , 即 只 有 黑 、 白 两 种 颜色 ,这 种 形式 通常 也 称 为 “黑白 艺术 ”位 图 
艺术 ”一 位 元 艺术 ”。 

2. 灰 度 图 像 

灰 度 图 像 一 般 指 具有 256 级 灰 度 值 的 数字 图 像 , 灰 度 图 像 只 有 灰 度 值 而 没有 彩色 。 因 
此 ,每 个 像素 都 是 介 于 黑色 和 白色 之 间 的 256 种 灰 度 中 的 一 种 。256 级 灰 度 值 图 像 的 数据 
类 型 为 8 位 无 符号 整数 , 灰 度 值 0 表示 纯 黑色 ,255 表示 纯 白 色 ,0 一 255 之 间 的 数字 由 小 到 
大 表示 从 纯 黑 到 纯 白 之 间 的 过 渡 色 。 二 值 图 像 可 以 看 成 是 灰 度 图 像 的 一 个 特例 。 

在 一 些 软件 中 , 灰 度 图 像 也 可 以 采用 双 精 度数 据 类 型 (double) 表 示 , 对 应 的 像素 值 域 为 
[0,1) ,其 中 0 代表 纯 黑色 ,1 代表 纯 白 色 ,0 一 1 之 间 的 小 数 表示 不 同 的 灰 度 等 级 。 

3. 索引 图 像 

索引 图 像 的 文件 结构 与 灰 度 图 像 和 RGB 图 像 文 件 不 同 , 它 既 包括 存放 图 像 数据 的 二 维 
矩阵 ,还 包括 一 个 颜色 索引 和 矩阵 ( 称 为 MAP) ,因此 称 为 索引 图 像 , 又 称 为 映射 图 像 。MAP 
矩阵 也 可 以 由 二 维 数组 表示 ,MAP 的 大 小 由 存放 图 像 的 矩阵 元 素 的 值 域 ( 即 灰 度 值 范围 
决定 。 例 如 ,车 矩阵 元 素 值 域 为 0~255, 则 MAP 和 矩阵 的 大 小 为 256X3, 和 矩阵 的 三 列 分 别 为 
R( 红 )`.G( 绿 )、B( 蓝 ) 值 ,以 MAP=[R G B] 表 示 。 图 像 矩 阵 的 每 一 个 灰 度 值 对 应 于 MAP 
中 的 一 行 ,如 某 一 像素 的 灰 度 值 为 64, 则 表示 该 像素 与 MAP 矩阵 的 第 64 行 建立 了 映射 关 
系 ,该 像素 在 屏幕 上 的 显示 颜色 由 MAP 矩阵 第 64 行 的 [R G B] 释 加 而 成 。 也 就 是 说 ,计算 
机 打开 图 像 文件 时 ,其 索引 矩阵 也 同时 读 和 人 ,图 像 每 一 像素 的 颜色 以 灰 度 值 作为 索引 ,通过 
检索 颜色 索引 矩阵 MAP 得 到 实际 颜色 。 计 算 机 中 ,索引 图 像 的 数据 类 型 一 般 为 8 位 无 符 
号 整 型 , 即 索 引 和 矩阵 MAP 的 大 小 为 256X3。 因 此 ,一 般 索 引 图 像 只 能 同时 显示 256 种 颜色 。 

与 灰 度 图 像 一 样 ,索引 图 像 的 数据 类 型 也 可 采用 双 精 度 浮 点 型 (double)。 索 引 图像 一 
般 用 于 存放 色彩 要 求 比 较 简单 的 图 像 , 如 Windows 中 色彩 构成 比较 简单 的 壁纸 多 采用 索引 
图 像 存放 ,如 果 图 像 的 色彩 比较 复杂 ,就 要 用 到 RGB 彩色 图 像 。 

4. RGB 彩色 图 像 

RGB 彩色 图 像 又 称 为 真 彩色 图 像 ,RGB 彩色 图 像 与 索引 图 像 都 是 计算 机 可 以 处 理 的 
彩色 图 像 。RGB 彩色 图 像 也 同样 以 及 .G、B 三 原色 的 释 加 来 表示 每 个 像素 的 颜色 。 与 索引 
图 像 不 同 的 是 ,RGB 彩色 图 像 每 一 个 像素 的 颜色 值 (由 RGB 三 原色 表示 ) 直 接 存放 在 图 像 
和 矩阵 中 ,不 需要 进行 索引 。 由 于 数字 图 像 以 二 维和 矩阵 表示 ,而 每 一 像素 的 颜色 需 由 R、G、B 
三 个 分 量 来 表示 ,因此 RGB 彩色 图 像 矩 阵 需要 采用 三 维 矩 阵 表 示 , 即 MXNX3 和 矩阵 ,M、N 
分 别 表示 图 像 的 行 、 列 数 ,三 个 MXN 的 二 维和 矩阵 分 别 表示 各 个 像素 的 R.G、B 颜 色 分 量 。 
RGB 彩色 图 像 的 数据 类 型 一 般 为 8 位 无 符号 整 型 ,通常 用 于 表示 和 存放 真 彩 色 图 像 ,当然 
也 可 以 存放 灰 度 图 像 。 

虽然 索引 图 像 和 RGB 彩色 图 像 都 可 以 存放 彩色 图 像 , 但 两 者 之 间 数 据 结 构 不 同 , 因 此 
存在 明显 差别 。 由 于 索引 图 像 所 表示 的 颜色 数量 是 由 索引 矩阵 MAP 的 大 小 决定 的 ,而 
MAP 的 大 小 又 由 像素 灰 度 值 的 值 域 决 定 , 所 以 在 8 位 无 符号 整 型 数据 的 情况 下 ,索引 图 像 
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只 能 表示 256 种 颜色 ; 而 RGB 彩色 图 像 则 将 每 一 像素 的 R.G、B 三 个 颜色 分 量 直接 存放 在 
三 维 图 像 矩 阵 中 ,因此 理论 上 其 所 表示 的 颜色 可 多 达 2* (2 X 2 X28 ) 种 颜色 , 远 远 多 于 索 
引 图 像 的 256(28 ) 种 颜色 ,而 且 像 素 的 颜色 直接 存放 在 图 像 矩阵 中 ,在读 取 数 据 时 无 须 索 
引 , 所 以 RGB 彩色 图 像 的 显示 速度 很 快 。 但 索引 图 像 也 有 自己 的 优点 。 首 先 ,其 所 占用 的 
存储 空间 远 远 小 于 RGB 彩色 图 像 , 因 此 在 对 图 像 颜色 要 求 不 高 的 情况 下 ,一 般 可 采用 索引 
图 像 存 放 彩 色 图 像 。 其 次 ,由 于 索引 图 像 的 颜色 值 存放 在 索引 和 矩阵 MAP 中 ,在 修改 图 像 的 
颜色 时 直接 修改 索引 矩阵 即 可 ,而 不 需要 修改 图 像 矩 阵 , 因 此 在 比较 选择 不 同 的 图 像 处 理 方 
案 时 ,索引 图 像 显得 非常 方便 。 

综 上 所 述 ,可 以 看 出 在 图 像 的 四 种 基本 类 型 中 , 随 着 图 像 所 表示 的 颜色 类 型 的 增加 ,图 
像 所 需 的 存储 空间 逐渐 增加 。 二 值 图 像 仅 能 表示 黑 、 白 两 种 颜色 ,但 所 需 的 存储 空间 最 少 ; 
灰 度 图 像 可 以 表示 由 黑 到 和 白 渐变 的 256 个 灰 度 级 ,每 个 像素 需要 一 个 字 节 存储 空间 ; 索引 
图 像 可 以 表示 256 种 颜色 ,与 灰 度 图 像 一 样 ,每 个 像素 需要 一 个 字 节 存储 ,而 为 了 表示 256 
种 颜色 ,还 需要 一 个 256X3 颜色 索引 矩阵 ; RGB 彩色 图 像 可 以 表示 2”* 种 颜色 ,相应 的 每 个 
像素 需要 3 字 节 的 存储 空间 ,是 灰 度 和 索引 图 像 的 3 倍 。 因 此 ,在 用 高 级 语言 (如 C++ ) 编 程 
存 取 不 同类 型 图 像 文 件 时 要 注意 文件 指针 的 最 小 寻 址 单元 。 表 2-1 给 出 了 四 种 基本 图 像 类 
型 表示 的 颜色 类 型 和 存储 空间 的 统计 (假设 图 像 大 小 为 MX N) 。 

表 2-1 四 种 图 像 类 型 的 比较 


图 像 类 型 | ”二 值 图 像 | 灰 度 图 像 | 索引 图 像 | RGB 彩 色 图 像 
颜色 数量 2 256 灰 度 256 彩色 24 彩 色 
数据 类 型 1bit 8bit 8bit 24bit 
矩阵 大 小 MXN MXN MXN MXNX3 


对 于 数字 图 像 处 理 技术 而 言 ,一 般 都 包括 以 上 这 四 种 基本 类 型 图 像 文件 。 此 外 ,在 多 媒 
体 技术 中 还 会 遇 到 高 维 图 像 , 即 图 像 矩 阵 的 维 数 大 于 3, 如 多 媒体 动画 图 像 ,由 于 一 个 动画 
图 像 可 包含 多 帧 RGB 彩色 图 像 , 因 此 动画 图 像 本质 上 是 四 维 矩 阵 MXNX3XP, 即 每 一 帧 
图 像 本 身 是 一 个 三 维 矩 阵 (MX NX3) ,而 动画 彩色 图 像 共 有 己 帧 RGB 彩色 图 像 。 


2.2 图 像 数字 化 器 


图 像 数 字 化 是 指 将 模拟 图 像 信息 转换 为 数字 信息 的 过 程 ,数字 相机 扫描 仪 等 设备 可 以 将 
现实 世界 中 的 模拟 连续 色调 的 可 视 信息 转换 为 计算 机 可 识别 的 数字 信息 ,这 就 是 数字 化 过 
程 。 图 像 数字 化 器 必须 能 够 将 一 幅 图 像 分 解 为 像素 并 确定 每 个 像素 的 位 置 ,测量 每 个 像素 的 
灰 度 级 ,将 所 测量 的 连续 亮度 信息 量化 形成 数字 信息 ,并 将 这 些 数 字 信 息 保存 在 存储 设备 上 。 

数字 图 像 处 理 的 早期 ,图 像 数字 化 设备 价格 非常 昂贵 ,结构 复杂 ,只 有 少数 研究 机 构 才 
可 以 使 用 , 随 着 微 电 子 技术 的 发 展 与 应 用 的 不 断 普 及 ,图 像 数 字 化 设备 价格 逐年 下 降 , 各 种 
各 样 的 设备 已 经 开始 应 用 于 图 像 数字 化 的 处 理 过 程 。 


2.2.1 图 像 数字 化 器 的 组 件 
一 般 而 言 , 一 个 能 将 模拟 图 像 信息 转换 为 数字 信息 的 图 像 数 字 化 器 必须 具有 如 下 6 个 
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基本 部 分 或 功能 组 件 。 

(1) 人 工 光源 : 常见 的 人 工 光源 主要 包括 白炽 灯 、 激 光 器 件 、 英 光 物 质 和 发 光 二 极 管 
(LED) 等 。 白 炽 灯 、 激 光 器 件 是 最 常用 的 人 工 光源 。 在 扫 出 系统 中 ,物体 或 图 片 的 数字 化 使 
用 白炽 灯 作为 光源 非常 方便 ,在 扫 入 系统 中 ,一 个 LED 的 细 丝 经 一 个 透镜 成 像 ,并 形成 一 个 


小 光 点 。 
(2) 采样 孔 : 使 图 像 数 字 化 器 能 不 受 图 像 其 他 部 分 的 影响 而 在 整 幅 图 像 中 扫描 特定 的 
独立 像素 单元 。 


(3) 扫描 器 件 : 其 作用 是 使 采样 孔 以 预先 确定 的 方式 在 图 像 上 移动 ,按照 顺序 依次 扫 
描 图 像 的 每 一 个 像素 。 扫 描 系 统 包 括 机 械 扫描 装置 .电子 束 聚 焦 和 集成 电路 等 。 如 图 2-1 
所 示 是 一 个 典型 的 机 械 扫描 装置 ,一 幅 照 片 ( 图 像 ) 部 分 或 全 部 卷 在 滚 简 上 , 滚 简 通 过 旋转 牵 
引 图 像 经 过 固定 的 采样 孔 ,形成 一 个 方向 上 的 扫描 。 采 样 孔 安装 在 引导 螺杆 上 ,引导 螺杆 旋 
转 使 采样 孔 在 图 像 上 移动 。 滚 简 和 引导 螺杆 结合 形成 对 二 维 图 像 的 扫描 。 如 果 引 导 螺 杆 连 
续 而 不 是 间 睦 转动 , 则 扫描 是 螺旋 式 进 行 的 ,但 已 非常 接近 直线 式 扫描 。 
图 像 传感器 或 发 射 源 滚 简 


图 2-1 机 械 扫 描 装 置 


(4) 光 传 感 器 : 通过 采样 孔 量 测 每 个 像素 的 亮度 信息 ,将 各 像素 的 光 强 信号 转换 为 电 
压 或 电流 信号 。 光 传感器 的 特点 是 可 以 产生 正比 于 光 强 的 电信 号 , 光 传 感 器 包括 光电 倍增 
管 、 光 电 二 极 管 .光电 品 体 管 . 光 敏 电阻 和 固体 传感器 。 

(5) 量化 器 : 将 传感器 输出 的 连续 信号 转换 为 离散 的 数字 信号 (整数 值 ) ,数字 化 部 件 
由 模 一 数 转换 器 电路 组 成 。 

(6) 输出 介质 : 将 量化 器 产生 的 灰 度 值 以 适当 格式 存储 起 来 ,以 备 数字 图 像 处 理 后 续 
使 用 。 输 出 介质 可 以 是 固态 存储 器 、 磁 盘 或 其 他 合适 的 存储 设备 。 


2.2.2 图 像 数 字 化 器 的 性 能 


虽然 不 同 的 图 像 数字 化 器 功能 不 尽 相 同 ,但 一 般 而 言 可 以 从 以 下 几 个 方面 选择 和 检查 
图 像 数 字 化 器 的 主要 性 能 和 参数 。 

(1) 像素 大 小 : 采样 尺寸 和 相 邻 像素 的 间距 是 两 个 重要 的 性 能 指标 ,如 果 图 像 数 字 化 
器 安装 了 放大 倍数 可 调 的 光学 系统 ,那么 输入 图 像 平面 上 的 采样 尺寸 和 间距 也 是 可 调 的 。 

(2) 图 像 尺 寸 : 图 像 数 字 化 器 可 处 理 的 最 大 图 像 尺寸 也 是 一 个 重要 参数 ,如 胶片 扫描 
仪 ,最 大 的 输入 尺寸 是 35mm 或 11X14inch(Clinch 王 2. 54cm) 的 X 光 片 。 对 于 输出 而 言 , 图 
像 尺 十 由 每 行 和 每 列 的 最 大 像素 数 决定 。 
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(3) 物理 参数 : 所 谓 物理 参数 , 即 图 像 数 字 化 仪器 能 测量 和 量化 的 物理 参数 。 以 胶片 
扫描 仪 为 例 , 可 以 测量 和 量化 胶片 的 透射 率 或 胶片 的 光 密 度 ,这 两 个 参数 均 为 胶片 明暗 度 的 
函数 ,但 对 不 同 的 应 用 ,透射 率 和 光 密 度 的 重要 程度 可 能 不 一 样 。 

(4) 线性 度 : 线性 度 是 指 对 光 强 进行 数字 化 时 , 灰 度 正比 于 图 像 亮度 的 实际 精确 程度 ,图 
像 数 字 化 器 的 线性 度 是 一 个 重要 的 性 能 指标 , 非 线性 的 数字 化 器 会 影响 后 续 处 理 的 有 效 性 。 

(5) 灰 度 级 : 能 将 图 像 量 化 为 多 少 级 灰 度 是 图 像 数 字 化 器 的 重要 性 能 指标 之 一 。 图 像 
数字 化 经 历 了 早期 的 黑白 两 级 灰 度 、 灰 度 图 像 (8 位 256 灰 度 级 ) 彩色 图 像 及 现在 的 RGB 
彩色 图 像 。 目 前 已 经 出 现 能 达到 更 高 分 辩 率 的 数字 化 器 。 

(6) 噪声 : 最 后 一 个 重要 特性 是 数字 化 器 的 噪声 水 平 。 如 果 用 数字 化 器 处 理 一 幅 均 匀 
的 灰 度 图 像 , 则 虽然 输入 亮度 是 一 个 常量 ,但 是 系统 中 的 固有 噪声 却 会 使 输出 图 像 的 灰 度 发 
生变 化 。 数 字 化 器 引入 的 噪声 是 图 像 质量 下 降 的 根源 之 一 ,应 当 使 噪声 小 于 图 像 内 的 反差 
( 即 对 比 度 ) 。 


2.2.3 图 像 数 字 化 器 的 类 型 


图 像 数字 化 器 主要 包括 数字 相机 和 胶片 扫描 仪 。 

数字 相机 (包括 数字 摄像 机 ) 是 一 类 种 类 繁多 而 又 重要 的 数字 化 器 , 它 可 以 数字 化 镜头 
前 的 任意 物体 ,如 具有 计算 机 接口 的 电视 摄像 机 。 数 字 相 机 不 仅 能 数字 化 实际 的 物体 ,还 能 
数字 化 相片 的 底片 。 

胶片 扫描 仪 也 是 一 种 非常 重要 的 图 像 数 字 化 器 。 尽 管 胶片 扫描 仪 目前 应 用 范围 有 限 ， 
但 依然 是 一 种 很 重要 的 图 像 数字 化 器 。 这 类 仪器 专用 于 扫描 胶片 上 的 摄影 图 像 ,首先 物体 
由 胶片 相机 摄影 ,然后 由 胶片 扫描 仪 将 其 图 像 数 字 化 。 胶 片 扫描 仪 曾经 在 图 像 处 理 过 程 中 
占有 突出 的 地 位 ,但 目前 人 们 更 倾向 于 直接 使 用 数字 相机 。 

图 像 数 字 化 一 般 有 扫 入 和 扫 出 两 种 方法 。 在 扫 出 方式 中 ,光线 连续 照射 整个 物体 或 胶 
片 图 像 ,采样 孔 每 次 仅 允 许 光 传感器 探测 到 一 个 像素 。 扫 入 方式 又 称 为 扫 进 方式 ,在 扫 人 方 
式 中 ,物体 每 次 只 有 一 小 点 被 照 亮 ,所 有 传 过 来 的 光线 都 被 传感器 收集 ,物体 由 光束 扫描 , 即 
在 这 种 情况 下 ,是 物体 被 照明 光线 扫描 ,而 传感器 则 “看 到 ”整个 场景 。 


2.3 ”图像 的 采样 和 量化 


目前 的 图 像 获取 方式 中 ,很 多 情况 下 ,传感器 输出 的 是 连续 变化 的 电压 信号 ,由 此 所 获 
得 的 图 像 是 模拟 图 像 信息 。 为 了 产生 一 幅 数 字 图 像 ,需要 进行 采样 与 量化 , 即 对 模拟 图 像 在 
空间 (z,y) 方 向 上 以 及 亮度 函数 /(z,y) 都 进行 离散 化 处 理 , 通 常 把 这 一 过 程 称 为 采样 与 量 
化 。 如 何 合理 地 进行 图 像 的 采样 与 量化 是 关系 数字 图 像 与 原 图 像 是 否 接近 的 两 个 重要 因 
素 , 也 关系 最 后 形成 的 数字 图 像 信息 量 的 大 小 。 


2.3.1 采样 


图 像 在 空间 (z,y) 上 的 离散 化 称 为 采样 ,具体 地 说 ,就 是 以 空间 上 部 分 点 的 灰 度 值 代表 
一 幅 图 像 ,而 这 些 点 称 为 采样 点 。 由 于 图 像 是 一 种 二 维 分 布 的 信息 ,因此 ,为 了 对 它 进行 采 
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样 操作 , 需 在 垂直 方向 和 水 平方 向 分 别 进行 采样 。 具 体 做 法 是 , 先 沿 垂直 方向 按 一 定 间隔 从 
上 到 下 顺序 地 沿 水 平方 向 直线 扫描 ,取出 各 水 平 线 上 灰 度 值 的 一 维 扫描 信息 。 而 后 再 对 一 
维 扫描 线 信 号 按 一 定 间隔 采样 得 到 离散 信号 , 即 先 沿 垂直 方向 采样 ,再 沿 水 平方 向 采样 ,这 
样 就 完成 了 二 维 图 像 的 数字 化 采样 操作 。 对 于 运动 图 像 ,即时 间 域 也 是 连续 的 图 像 , 则 需 先 
在 时 间 轴 上 采样 ,再 沿 垂直 方向 采样 ,最 后 沿 水 平方 向 采样 。 

如 果 对 图 像 按照 等 间距 进行 采样 ,每 行 ( 即 横向 ) 取 M 个 点 ,每 列 ( 即 纵向 ) 取 N 个 点 ， 
则 图 像 被 排列 为 MX N 的 矩阵 ,矩阵 中 的 每 一 个 点 对 应 于 数字 图 像 中 的 一 个 元 素 , 称 为 像 
素 或 像素 点 。 因 此 ,该 图 像 也 称 为 具有 MX N 像素 的 图 像 。 采 样 点 的 多 少 和 采样 间隔 的 选 
取 是 一 个 非常 重要 的 问题 , 它 直 接 影 响 到 采样 后 图 像 的 质量 , 即 数字 图 像 与 原 图 像 的 失真 程 
度 。 以 一 维 信和 号 为 例 , 若 一 维 信号 jz) 的 最 大 频率 为 w, 根 据 采样 定理 


f= >) GT)sG 一条) 人 
式 中 si= sin(2xwt ) (2-2) 
2wt 


以 T<1/(2w) 为 间隔 进行 采样 ,能 够 根据 采样 结果 f(iT) (i 二 …, 一 1,0,1,…) 完 全 你 复 
了 (1)。 对 于 同样 采样 点 数 ,采样 过 程 还 可 以 分 为 均匀 采样 和 非 均匀 采样 。 

在 对 图 像 进行 采样 的 过 程 中 , 若 在 (z,y) 方 向 上 均 进行 等 间距 的 采样 , 则 称 为 均匀 采 
样 , 反 之 , 则 称 为 非 均匀 采样 。 

非 均 匀 采 样 是 指 在 图 像 的 不 同 区域 , 根 据 图 像 的 具体 情况 进行 不 等 间隔 的 采用 。 非 均 
匀 采 样 的 间隔 选取 要 依据 原 图 像 中 包含 的 细微 浓淡 变化 情况 决定 。 一 般 地 ,图 像 中 细节 越 
多 ,采样 间隔 越 小 。 因 此 ,一 般 在 图 像 细节 少 的 区 域 采 用 比较 稀 朴 的 采样 ,在 细节 变化 大 的 
区 域 采 用 较 密 的 采样 ,这 样 , 所 获得 的 图 像 有 用 信息 量 并 没有 减少 ,但 总 数据 量 却 有 效 地 降 
低 了 。 需 要 指出 的 是 ,在 分 配 采样 点 时 ,应 在 灰 度 变化 的 边界 上 记录 下 非 均 匀 采 样 的 边界 。 
例如 , 若 图 像 由 均匀 的 背景 上 放 园 的 一 东 花 或 其 他 物体 组 成 , 则 背景 可 采用 稀 玖 采样 ,而 花 
的 部 分 则 应 采用 较 密 的 采样 ,并 标 出 非 均匀 采样 的 边界 。 


2.3.2 量化 


模拟 图 像 经 过 采样 以 后 ,在 时 间 和 空间 上 被 离散 化 为 像素 ,但 采样 所 得 到 的 像素 值 依然 
是 连续 量 。 量 化 过 程 就 是 以 离散 的 灰 度 值 信息 代替 连续 的 模拟 量 灰 度 信息 的 过 程 ,该 过 程 
是 一 对 多 的 映射 过 程 。 量 化 可 以 分 为 线性 量化 和 非 线性 量化 两 种 方式 。 

1. 线性 量化 

模拟 图 像 的 亮度 值 /是 连续 变化 的 数值 ,车 /(x,y) 的 亮度 值 工 的 范围 为 [Ls ,Los]， 
则 称 区 间 [Lsis ,Lmsx 为 灰 度 级 范围 (或 色 度 范围 )。 如 图 2-2 所 示 , 若 将 灰 度 值 区 间 [Lsi,， 
Lmsx 分 成 个 等 间距 的 子 区 间 , 则 称 为 线性 量化 或 等 间隔 量化 。 


Lmin Lmax 
LTD 


共 分 为 K 个 灰 度 级 t 


图 2-2 线性 量化 示意 图 
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量化 过 程 中 每 个 子 区 间 对 应 一 个 亮度 值 g; ,这样 在 灰 度 值 范围 [Ls ,Ls ] 内 就 有 下 个 
亮度 值 对 应 , 称 为 灰 度 级 天 。 为 了 计算 机 处 理 的 方便 , 灰 度 级 下 一 般 以 2 的 整数 次 寡 表 示 ， 
即 KK==2”,m 二 1,2,…,8 等 ,车 m 二 8, 则 KK 二 256 ,表示 共有 256 个 灰 度 级 。 

当 /(z,y) 的 连续 亮度 值 被 个 离散 的 亮度 值 取代 ,对 于 第 i 个 点 , 取 值 为 g; ,如 何 表示 
每 一 个 采样 点 的 亮度 值 也 是 最 终 影响 数字 图 像 质量 的 关键 因素 之 一 。 因 此 , 灰 度 级 的 选 
择 决 定 了 数字 图 像 的 质量 ,也 决定 了 数字 图 像 所 占 计算 机 存储 空间 的 大 小 。 例 如 ,一 幅 单 色 
调 灰 度 级 为 64 的 128X128 的 图 像 ,需要 128X128X6 二 98 304 位 表示 。2 二 64, 即 位 深度 
为 6, 位 深度 越 深 ,能 表示 的 灰 度 级 就 越 多 。 一 般 情况 下 计算 机 表示 单 色 调 图 像 普 遍 采 
256 个 灰 度 级 ,因此 位 深度 为 8。 如果 是 一 幅 128 X128 的 彩色 图 像 ,每 个 RGB 颜色 分 量 都 
用 256 个 灰 度 级 表示 ,需要 128X128X8X3 位 表示 , 即 每 一 个 像素 实际 上 需 用 24 位 表示 。 

图 2-3 所 示 是 在 256 级 灰 度 不 变 的 情况 下 ,不 同 采样 点 数 的 数字 图 像 质量 对 比 。 图 2-3(a) 
为 512X512 采样 ,图 2-3(b) 为 256X256 采样, 图 2-3(c) 为 64X64 采 样 ,图 2-3(d) 为 32X 
32 采样 ,图 2-3(e) 为 16X16 采样 ,图 2-3(f) 为 8X8 有 采样。 可 以 看 出 ,同样 灰 度 级 下 ,图像 
质量 会 因 采 样 点 数 的 减少 ,效果 逐渐 变 差 , 当 采样 点 数 过 少时 ,图像 可 能 无 法 分 辨 。 


(a) 512X512 采 样 (b) 256X256 采 样 


(d) 32X32 采 样 (e) 16X 16 采 样 (f) 8X8 采 样 
图 2-3 采样 数 改 变 灰 度 级 不 变 
同样 ,车 灰 度 级 数量 减 小 ,对 图 像 质量 也 具有 明显 的 影响 。 如 图 2-4 所 示 ,(a) 为 256 灰 
度 级 ,(b) 为 128 灰 度 级 ,(c) 为 64 灰 度 级 ,(d) 为 16 灰 度 级 。 通 过 该 图 可 以 看 出 ,对 于 数字 
图 像 , 若 采样 数 不 变 , 当 灰 度 级 数量 减少 到 一 定 程度 ,对 图 像 质量 也 将 产生 一 定 的 不 利 影响 。 


(a) 256 灰 度 级 (b) 128 灰 度 级 (©) 64 灰 度 级 (d) 16 灰 度 级 
图 2-4 采样 数 不 变 灰 度 级 改变 
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2. 非 线性 量化 

与 线性 量化 的 等 间隔 划分 灰 度 区 间 相 反 , 若 将 表示 数字 图 像 的 灰 度 级 范围 分 为 不 等 间 
隔 的 子 区 间 , 则 称 为 非 线性 量化 或 非 均 匀 量 化 。 与 均匀 采样 和 非 均匀 采样 的 概念 类 似 , 对 于 
灰 度 级 出 现 频 度 高 的 范围 可 以 选择 较 窒 的 量化 区 间 ,对 于 一 些 灰 度 级 出 现 频 度 较 低 的 范围 
可 以 选择 较 宽 的 量化 区 间 。 
图 2-5 为 例 ,同样 量化 为 16 个 子 区 域 ,(a) 为 等 间隔 的 线性 量化 , 即 图 像 整 个 灰 度 区 
间 以 相同 间隔 量化 ;(b) 表 示 在 中 间 灰 度 级 出 现 频 度 高 的 范围 内 ,量化 区 间 变 罕 ,而 两 端的 
灰 度 级 因 出 现 频 度 较 低 ,量化 区 间 则 变 宽 ,从 而 可 以 控制 中 间 灰 度 级 部 分 的 图 像 细 节 内 容 的 
信息 量 损 失 程 度 ,因此 可 以 实现 以 较 少 的 灰 度 级 量化 图 像 , 也 能 尽 可 能 得 到 较 高 的 图 像 
质量 。 


法 


| (a) 线性 量化 为 16 个 子 区 间 | 


| | | TNH | | | 
(b) 间 线 性 遇 化 为 16 个 子 区 间 
图 2-5 非 线性 与 线性 量化 对 照 


2.3.3 采样 与 量化 参数 的 选择 


虽然 采样 和 量化 参数 都 对 数字 图 像 的 质量 具有 影响 ,但 实际 上 两 个 参数 之 间 的 匹配 关 
系 也 非常 重要 。 并 不 是 一 味 地 提高 采样 点 数 和 灰 度 级 数量 就 可 以 获得 高 清晰 度 且 高 质量 的 
数字 图 像 ,在 确定 采样 和 量化 参数 时 ,还 应 根据 原始 图 像 的 性 质 与 质量 进行 科学 、 合 理 的 选 
择 。 例 如 ,在 某 些 情况 下 ,对 细节 比较 少 的 图 像 , 当 采样 点 数 一 定 时 ,图 像 的 质量 有 可 能 会 随 
着 灰 度 级 的 减少 而 得 到 一 定 程 度 的 改善 ,原因 是 减少 灰 度 级 会 增加 图 像 的 对 比 度 。 


2.4 像素 基本 关系 


进行 图 像 处 理 和 分 析 时 ,许多 运算 只 和 当前 像素 的 灰 度 值 有 关 , 因 此 对 这 些 操作 只 需 考 
虑 当前 像素 的 灰 度 值 , 如 常见 的 对 比 度 拉 伸 直方 图 均衡 化 .直方 图 规定 化 等 运算 。 但 也 有 
一 些 其 他 运算 和 处 理 需 要 考虑 当前 处 理 像素 与 其 周围 相 邻 像素 的 关系 ,如 边缘 提取 、 图 像 分 
割 等 运算 。 本 节 将 介绍 在 图 像 处 理 中 经 常 遇 到 的 像素 间 基 本 关系 ,为 后 续 的 学 习 打 下 基础 。 


2.4.1 像素 的 邻接 


图 像 处 理学 科 中 ,像素 的 邻接 表示 像素 间 的 空间 接近 关系 。 以 二 维 数字 图 像 为 例 , 图 像 
中 的 每 一 个 像素 类 似 于 离散 网 格 中 的 一 个 点 , 即 网 格 中 的 一 个 小 方 格 。 对 于 图 像 中 的 每 一 
个 像素 ,在 空间 位 置 上 与 它 邻 接 的 像素 构成 它 的 邻 域 。 设 任意 像素 p 的 坐标 为 (z,y), 则 该 
像素 的 4 邻 域 定义 为 其 上 、 下 \ 左 \ 右 的 4 个 像素 如 图 2-6(a) 所 示 , 这 4 个 像素 在 图 中 用 -~ 表 
示 , 其 坐标 分 别 为 (x,y 一 1)、(z,y 十 1)、(z 一 1,y)、(z 十 1,y)。 
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该 像素 上 、 下 、 左 、 右 的 4 个 像素 通常 记 为 N,(p) ,在 一 些 参 考 文献 中 ,该 四 个 位 置 按 方 
位 也 可 称 为 东 (east) 、 西 (west) 、 南 (south) 、 北 (nonh)。 

与 四 邻 域 类 似 , 当 前 像素 上 、 下 、 左 、 右 4 个 方向 ,加 上 左上 、 左 下 、 右 上 和 右 下 4 个 沿 对 
角 线 方向 的 相 邻 像素 , 称 为 当前 像素 p 的 8 邻 域 ,如 图 2-6(c) 所 示 , 记 为 Ns (p)。 

其 中 ,左上 、 左 下 、 右 上 和 右 下 4 个 相 邻 像素 的 坐标 分 别 为 (z 一 1,y 一 1)、(z 一 1,y 十 1)、 
(z+ ly+ Ds (+153— Ds 

上 述 4 个 像素 (图 中 以 ; 表示) 定义 为 p 点 的 对 角 邻 域 , 记 为 Np(p), 如 图 2-6(b) 所 示 。 


在 图 像 分 析 与 处 理 中 ,经 常 使 用 4 邻 域 和 8 邻 域 的 概念 ,对 角 邻 域 的 单独 应 用 并 不 多 。 
站 | 潭 r p ri|lp Ls 
(a) 4 邻 域 (b) 对 角 邻 域 (c) 8 邻 域 
图 2-6 像素 的 邻 域 
2.4.2 邻接 性 .连通 性 .区 域 和 边界 


1. 邻接 性 

邻接 性 是 指 满足 某 一 个 灰 度 相似 性 定义 的 两 个 像素 p 和 g 是 否 具有 上 节 所 描述 的 相 邻 
关系 中 的 一 种 。 例 如 ,车 定义 灰 度 集合 C= {a 三 cb)),p 和 g 同属 于 C, 当 pp 处 在 g 的 4 邻 
域 中 时 , 则 称 它 们 为 4 邻接 ; 类 似 地 ,如 果 p 处 在 g 的 8 邻 域 或 对 角 邻 域 中 , 则 称 它们 具有 
8 邻接 关系 ,或 对 角 邻 接 关系 。 

在 介绍 邻接 性 之 前 , 先 介 绍 关于 m 邻接 的 定义 。 

m 邻接 是 指 p 在 g 的 4 邻 域 中 ,或 p 在 g 的 对 角 邻 域 中 且 p 和 g 的 4 邻 域 的 交集 为 空 
集 , 即 交集 中 不 存在 属于 集合 C 的 像素 。 

在 不 同 的 灰 度 集合 定义 下 ,图 像 中 两 个 像素 的 邻接 关系 可 能 不 
一 样 。 如 图 2-7 所 示 , 当 集合 C=={2} 时 ,坐标 点 (1,1) 和 (2,2) 是 m 
邻接 关系 。 因 为 它们 同属 于 集合 C, 且 它们 4 邻 域 的 交集 点 (1,2) 和 
点 (2,1) 不 属于 集合 C。 若 所 选择 的 集合 C 为 {1,2} ,这 时 由 于 坐标 
点 (1,2) 的 值 为 1, 属 于 集合 C, 因 此 ,(1,1) 和 (2,2) 就 不 是 m 邻接 关 
系 , 但 它们 均 与 点 (1,2) 形 成 了 m 邻接 关系 。 

2. 连通 性 

当 坐 标 位 置 为 p(x1,y1) 的 像素 与 坐标 位 置 为 q(x2,y2) 的 两 个 像素 按 某 种 邻接 关系 存 
在 一 条 连通 的 路 径 时 , 称 它们 是 连通 的 。 由 像素 点 p 到 g 所 经 历 的 路 径 的 像素 点 序列 称 为 
由 p 到 g 的 路 径 , 从 点 出 发 沿路 径 到 g 点 所 需 走 的 步 数 称 为 路 径 的 长 度 。 

需要 指出 的 是 ,在 分 析 图 像 区 域 的 连通 性 时 .一 般 需 要 根据 邻接 关系 来 确定 所 考虑 的 
4 连通 、8 连通 ,还 是 六 连通 。 因 为 有 些 像素 在 4 邻接 条 件 下 是 不 连通 的 ,但 在 8 邻接 的 条 
件 下 则 是 连通 的 ,如 图 2-7 所 示 , 当 集合 C 为 {2) 时 ,对 于 坐标 点 (1,1) 和 (2,2) ,如 考虑 8 连 
通 性 , 则 它们 是 连通 的 ,但 对 于 4 连通 ,它们 是 不 连通 的 。 
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还 是 以 图 2-7 为 例 , 当 C 定义 为 {2} 时 , 当 计算 路 径 长 度 时 ,由 p(2,2) 到 gq(4,4) 不 存在 
4 连通 的 路 径 , 但 存在 长 度 分 别 为 2 和 3 的 两 条 8 连通 路 径 , 分 别 是 {(2,2)、(3,3)、(4,4)} 
和 {(2,2) (3,3),(4,3),(4,4)) ,而且 存 在 一 条 路 径 长 度 为 3 的 m 连通 路 径 {(2,2),(3,3)， 
(4,3),(4,4)} ,而 且 该 路 径 是 唯一 的 。 由 此 可 见 ,m 邻接 的 特点 是 ,在 计算 路 径 长 度 或 描述 
区 域 边界 时 具有 唯一 性 ,不 存在 二 义 性 。 

3. 区 域 和 边界 

在 一 幅 图 像 中 。 由 连通 的 像素 点 所 组 成 的 点 的 集合 称 为 一 个 区 域 。 对 于 区 域 中 的 某 一 
像素 ,如 果 存 在 某 一 个 邻 域 不 属于 这 一 区 域 , 则 称 它 是 该 区 域 的 边界 点 。 一 个 区 域 的 所 有 边 
界 点 组 成 该 区 域 的 边界 ,由 于 这 些 边界 点 在 区 域内 ,该 边界 称 为 区 域 的 内 边界 。 类 似 地 , 若 
边界 点 并 不 在 当前 考虑 区 域内 ,但 这 些 边 界 点 有 一 个 邻 域 属 于 当前 区 域 , 则 称 为 该 区 域 的 外 
边界 ,所 有 满足 外 边界 定义 条 件 的 像素 点 组 成 了 区 域 的 外 边界 。 

与 连通 性 相似 ,区 域 也 分 为 4 连通 区 域 和 8 连通 区 域 , 如 图 2-7 所 示 ,如果 集合 C 为 {2} 
时 ,根据 4 连通 性 , 则 图 2-7 中 具有 5 个 值 为 2 的 区 域 , 坐 标点 (1,1) 和 (2,2) 分 别 属于 不 同 
的 连通 区 域 ; 如 车 根据 8 连通 属性 , 则 坐标 点 (1,1) 和 (2,2) 属 于 同一 个 连通 区 域 ,图 中 仅 有 
3 个 值 为 2 区 域 。 

与 此 相关 的 另 一 个 概念 是 边缘 (edge) 和 边界 (border) 。 边 缘 是 指 图 像 中 灰 度 值 存 在 差 
异 的 地 方 , 通 常 是 指 相 邻 像素 之 间 的 灰 度 值 差 异 大 于 某 一 个 阔 值 (相关 的 内 容 后 续 章 节 中 将 
做 进一步 的 介绍 ) ,图 像 内 区 域 或 物体 之 间 的 边缘 并 不 一 定 组 成 一 个 闭合 轮廓 ; 而 边界 通常 
对 应 于 某 一 个 物体 的 轮廓 (contour) ,因此 边界 是 闭合 的 。 


2.4.3 ”距离 度量 


像素 之 间 的 关系 与 像素 在 空间 上 的 接近 程度 相关 ,像素 在 空间 的 接近 程度 可 以 用 距离 
进行 衡量 。 众 所 周知 ,根据 数学 知识 ,距离 有 多 种 定义 ,在 图 像 处 理 知识 体系 框架 内 ,距离 也 
包括 多 种 定义 。 给 定 三 个 像素 的 坐标 分 别 为 p(z,y)、g(s,t) .~(Cuyu), 若 满足 以 下 三 个 基本 
条 件 , 则 度量 函数 D 能 称 为 距离 。 

(1) 非 负 性 : D(p,q) 宇 0, 当 且 仅 当 p 二 g 时 等 号 成 立 。 

(2) 对 称 性 : D(p,q) 二 D(g,p)。 

(3) 三 角 不 等 式 : D(p,qg) 志 DC(p.r) 十 D(r,q)。 

上 述 三 个 条 件 中 ,条 件 (1) 保 证 了 距离 的 非 负 性 ; 条 件 (2) 表 明 两 个 像素 点 之 间 的 距离 与 
像素 点 的 起 终点 没有 关系 ; 条 件 (3) 表 明 两 个 像素 点 之 间 的 距离 ,其 直线 距离 最 短 。 在 数字 图 
像 处 理 中 ,距离 的 定义 也 必须 满足 以 上 三 个 条 件 ,图像 处 理 常用 的 距离 定义 包括 以 下 几 种 。 


(1) 欧 氏 距离 : 
D.(psq) = VCz 一 9)5 十 (y 一 0 (2-3) 

(2) 城市 距离 : 
Di(ps9) 一 | z—s|+| y—z| (2-4) 

(3) 棋盘 距离 : 


Das ( 力 ,9) = max(| zx 一 5|，| y 一 上 | (2=59 
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图 2-8 等 距离 轮廓 示意 图 


2.5 图 像 文件 格式 


图 像 文件 格式 是 记录 和 存储 影像 信息 的 格式 。 对 数字 图 像 进 行 存储 ,传输 、 处 理 ,必须 采 
用 一 定 的 图 像 格 式 , 也 就 是 把 图 像 的 像素 按照 一 定 的 方式 进行 组 织 和 存储 ,将 图 像 数 据 存储 为 
文件 就 成 为 图 像 文件 。 图 像 文 件 格式 决定 了 图 像 文 件 的 数据 结构 信息 ,以 及 文件 如 何 与 其 他 
文件 交换 数据 等 。 常 见 的 图 像 格 式 文件 包括 BMP、JPEG、PNG、TIFF、GIF、RAW 等 。 由 于 数 
字 设 备 获 取 的 图 像 文 件 一 般 都 很 大 ,而 储存 容量 却 有 限 , 因 此 图 像 通常 都 会 经 过 压缩 再 储存 。 


2.5.1 BMP 文件 


BMP 是 英文 Bitmap( 位 图 ) 的 简写 ,即位 图 文件 ,是 一 种 与 硬件 设备 无 关 (device- 
independent Bitmap) 的 图 像 文件 格式 。BMP 文件 是 Windows 系统 中 的 标准 图 像 文件 格 
式 , 被 很 多 Windows 应 用 程序 支持 。 随 着 Windows 系统 的 流行 及 应 用 程序 的 不 断 丰 富 ， 
BMP 位 图 格式 得 到 了 越 来 越 广泛 的 应 用 。BMP 文件 采用 位 映射 存储 格式 ,其 特点 是 包含 
的 图 像 信 息 较 丰富 , 除 位 图 深度 可 选 之 外 ,不 进行 任何 其 他 压缩 ,但 由 此 也 导致 了 它 与 生 俱 
来 的 缺点 是 占用 磁盘 空间 过 大 。BMP 图 像 文件 的 深度 可 以 选择 1bit、4bit、8bit、24bit。 采 
用 该 格式 存储 图 像 时 ,BMP 图 像 的 扫描 按照 从 左 到 右 、 从 下 到 上 的 顺序 进行 。 

BMP 图 像 文 件 格 式 一 般 由 文件 头 信 息 块 、 图 像 描 述 信息 块 .颜色 表 ( 真 彩 图 像 无 颜色 表 ) 
和 图 像 数据 区 四 个 部 分 组 成 ,并 以 BMP 为 扩展 名 。 由 于 BMP 文件 格式 是 Windows 环境 中 交 
换 与 图 有 关 的 数据 的 一 种 标准 ,因此 在 Windows 环境 中 运行 的 图 形 图 像 软 件 都 支持 BMP 图 
像 格式 。 

1. BMP 文件 的 组 成 

BMP 文件 由 位 图 文件 头 、 位 图 信息 头 、 颜 色 信 息 ( 调 色 板 数据 ) 和 位 图 数据 共 四 个 部 分 
组 成 ,如 表 2-2 所 示 。 


表 2-2 BMP 文件 结构 


BMP 文件 组 成 数据 结构 表示 
位 图 文件 头 BITMAPFILEHEADER 
位 图 信息 头 BITMAPINFOHEADER 
颜色 信息 RGBQUAD 
位 图 数据 BYTE 
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2. 


BMP 文件 头 


BMP 文件 头 数据 含有 BMP 文件 的 类 型 .文件 大 小 和 位 图 起 始 位 置 (相对 于 位 图 文件 头 
的 偏 移 量 ) 等 信息 。FILEHEADER 结构 占 14 字 节 ,其 定义 如 下 : 


typedef struct tagBITMAPFILEHEADER 


{ 


WORD bfType; 
DWORD bfSize; 
WORD bfReserved1 
WORD bfReserved2; 
DWORD bfOffBits; 


} BITMAPFILEHEADER; 


3. 


位 图 信息 头 


// 位 图 文件 的 类 型 ,必须 为 BM( 第 1.2 字 节 ) 

// 位 图 文件 的 大 小 ,以 字 节 为 单位 (第 3 一 6 字 节 ) 

// 位 图 文件 保留 字 , 必须 为 0( 第 7、8 字 节 ) 

// 位 图 文件 保留 字 , 必须 为 0( 第 9、10 字 节 ) 

// 位 图 数据 的 起 始 位 置 , 以 相对 于 位 图 (第 11 一 14 字 节 ) 
文件 头 的 偏 移 量 表示 ,以 字 节 为 单位 


BMP 位 图 信息 头 数据 用 于 说 明 位 图 的 尺寸 等 信息 ,主要 包括 位 图 大 小 、 像 素 深度 ,位 图 
是 否 压缩 等 信息 。 位 图 信息 头 共 占 40 字 节 ,其 定义 如 下 : 


typedef struct tagBITMAPINFOHEADER 


{ 


DWORD biSize; 
LONG biWidth; 
LONG biHeight; 
WORD biPlanes; 
WORD biBitCount; 


DWORD biCompression; 
DWORD biSizeImage; 
LONG biXPelsPerMeter; 
LONG biYPelsPerMeter; 


DWORD biClrUsed; 
DWORD biClrImportant; 


} BITMAPINFOHEADER; 


对 于 BMP 格式 的 图 像 文 件 ,无 论文 件 尺 寸 的 大 或 小 ,都 不 会 对 数据 进行 任何 压缩 处 


理 。 如 果 位 图 文件 采用 压缩 格式 , 则 16 色 位 图 采用 RLE-4 压缩 算法 ,256 色 位 图 采用 


RLE-8 
4. 


颜色 表 


// 本 结构 所 占用 的 字 节 数 (第 15 一 18 字 节 ) 
// 位 图 的 宽度 , 以 像素 为 单位 (第 19 一 22 字 节 ) 
// 位 图 的 高 度 , 以 像素 为 单位 (第 23 一 26 字 节 ) 
// 目 标 设备 的 级 别 ,必须 为 1( 第 27、28 字 节 ) 
// 每 个 像素 所 需 的 位 数 (第 29、30 字 节 ); 设置 为 1 表示 二 值 图 像 , 设 
置 为 4 表示 16 色 ; 设置 为 8 表示 256 色 ; 设置 为 24 表示 真 彩色 
// 位 图 压缩 类 型 (第 31 一 34 字 节 ); 设置 为 0 表示 不 压缩 , 设置 为 1 
表示 BI_RLE8 压缩 类 型 ; 设置 为 2 表示 BI_RLE4 压缩 类 型 

// 位 图 的 大 小 (其 中 包含 为 补 齐 行 数 是 4 的 倍数 而 添加 的 空 字 节 )， 
以 字 节 为 单位 (第 35 一 38 字 节 ) 

// 位 图 水 平分 辩 率 ,每 米 像素 数 (第 39 一 42 字 节 ) 

// 位 图 垂直 分 辩 率 ,每 米 像素 数 (第 43 一 46 字 节 ) 

// 位 图 实际 使 用 的 颜色 表 中 的 颜色 数 (第 47 一 50 字 节 ) 

// 位 图 显示 过 程 中 重要 的 颜色 数 (第 51 一 54 字 节 ) 


颜色 信息 包含 本 图 像 用 到 的 颜色 表 , 显 示 图 像 时 需要 用 该 颜色 表 来 生成 调 色 板 。 如 果 
图 像 为 RGB 真 彩色 图 像 , 图 像 的 每 一 像素 用 24bit 表示 ,这 时 图 像 文件 中 没有 颜色 表 信 息 
块 。 颜 色 表 用 于 说 明 位 图 中 的 颜色 , 它 有 若干 个 表 项 ,每 一 个 表 均 是 一 个 RGBQUAD 类 型 
的 结构 ,定义 一 种 颜色 。RGBQUAD 结构 的 定义 如 下 : 


typedef struct tagRGBOURD 


{ 


BYTE rgbBlue; 


// 蓝 色 的 亮度 (范围 : 0 一 255) 
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BYTE rgbGreen; // 绿 色 的 亮度 (范围 : 0 一 255) 
BYTE rgbRed; // 红 色 的 亮度 (范围 : 0 一 255) 
BYTE rgbReserved; // 保 留 ,必须 为 0 

} RGBQUAD; 


颜色 表 RGBQUAD 结构 数据 的 个 数 由 biBitCount 来 确定 。 当 biBitCount 一 1,4,8 时 ， 
分 别 有 2,16,256 个 颜色 表 项 ; 当 biBitCount 一 24 时 ,为 真 彩色 图 像 , 每 个 字 节 分 别 对 应 RR、 
G.B 值 ,此 时 图 像 无 颜色 表 项 。 在 BMP 文件 的 颜色 信息 表 RGBQUARD 结构 中 增加 了 一 
个 保留 字段 rgbReserved, 它 不 代表 任何 颜色 信息 ,但 必须 取 固 定 值 0。 

根据 上 述 RGBQUARD 结构 对 颜色 信息 的 定义 , 红 、 绿 、 蓝 排列 顺序 与 一 般 真 彩色 图 像 
文件 的 颜色 排列 顺序 正好 相反 。 即 一 个 位 图 中 某 一 像素 点 的 颜色 为 “FF、00、00、00”, 则 表 
示 该 点 为 蓝 色 , 而 不 是 红色 。 

位 图 信息 头 和 颜色 表 组 成 位 图 信息 BITMAPINFO 数据 结构 ,BITMAPINFO 结构 定 
义 如 下 : 


typedef struct tagBITMAPINFO 
{ 


BITMAPINFOHEADER bmiHeader; // 位 图 信息 头 
RGBQUAD bmiColors; // 颜 色 表 

} BITMAPINEO; 

5. 位 图 数据 


BMP 文件 中 的 位 图 数据 表示 图 像 对 应 的 像素 值 。 位 图 数据 记录 了 位 图 的 每 一 个 像素 
值 ,图 像 像 素 值 的 记录 顺序 在 扫描 行内 是 从 左 到 右 , 在 扫描 行 之 间 是 从 下 到 上 。 即 BMP 文 
件 首 先 存放 的 是 图 像 的 最 后 一 行 像素 ,最 后 存储 图 像 的 第 一 行 像素 值 ,对 于 同一 行 之 间 的 像 
素 值 , 则 按照 先 左边 后 右边 的 顺序 存储 。 

位 图 的 一 个 像素 值 所 占 的 字 节 数 : 

当 biBitCount 二 1 时 ,8 个 像素 占 1 字 节 ; 

当 biBitCount 二 4 时 ,2 个 像素 占 1 字 节 ; 

当 biBitCount 二 8 时 ,1 个 像素 占 1 字 节 ; 

当 biBitCount 一 24 时 ,1 个 像素 占 3 字 节 , 按 顺序 分 别 为 B、G、R 值 。 

Windows 规定 一 个 扫描 行 所 占 的 字 节 数 必须 是 4 的 倍数 ( 即 以 long 为 单位 ) ,不 足 则 以 
0 填充 ,位 图 每 一 扫描 行 的 字 节 数 : 

DataSizePerline= (bi. biWidth x bi. biBitCount 十 31)78 

位 图 数据 的 大 小 : DataSizePerline Xx biHeight 

车 BMP 文件 起 始 部 分 数据 如 下 : 
424D 46900000 0000 0000 4600 0000 2800 0000 8000 0000 9000 0000 0100 * 1000 0300 
0000 0090 0000 AOOF 0000 AOOF0000 0000 00000000 0000 * 00F8 E007 1F00 0000 x* 02F1 
84F1 04F1 84F1 84F1 06F2 84F1 06F2 04F2 86F2 06F2 86F2 86F2… 
其 中 ,1 一 14 字 节 为 图 像 文件 头 , 数 据 所 表示 的 含义 分 别 如 下 。 

(1) 1、2: (这 里 的 数字 代表 的 是 字 节 ,下 同 ) 图 像 文件 头 。0x4d42 王 'BM ', 即 BMP 
格式 。 
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(2) 3 一 6: 整个 文件 大 小 。4690 0000, 即 00009046h 一 36934。 

(3) 7、8: 保留 ,必须 设置 为 0。 

(4) 9、10: 保留 ,必须 设置 为 0。 

(5) 11 一 14: 从 文件 开始 到 位 图 数据 之 间 的 偏 移 量 (14 十 40 十 4 * 2^biBitCount)) (在 有 
颜色 板 的 情况 下 )。4600 0000 ,为 00000046h 王 70, 上 面 的 文件 头 就 是 35 字 王 70 字 节 。 

15 一 54 为 位 图 信息 头 数据 ,数据 含义 如 下 。 

(6) 15 一 18: 位 图 信息 头 长 度 。 

(7) 19 一 22: 位 图 宽度 ,以 像素 为 单位 。8000 0000 ,为 00000080h 王 128 。 

(8) 23 一 26: 位 图 高 度 , 以 像素 为 单位 。9000 0000 ,为 00000090h 王 144。 

(9) 27、.28: 位 图 的 位 面 数 ,该 值 总 是 1。0100 ,为 0001h 二 1。 

(10) 29、30: 每 一 像素 的 位 数 。1( 单 色 ),4(16 色 ),8(256 色 ),16(64K 色 ,高 彩色 ) ,24 
(16M 色 , 真 彩色 ),32(4096M 色 , 增 强 型 真 彩色 )。1000 为 0010h 王 16。 

(11) 31~34: 压缩 信息 说 明 , 即 0( 不 压缩 ),1(RLE 8,8 位 RLE 压缩 ),2(RLE 4,4 位 
RLE 压缩 ,3(Bitfields, 位 域 存放 )。 

(12) 35 一 38: 用 字 节 数 表示 的 位 图 数据 的 大 小 ,该 数 必须 是 4 的 倍数 ,数值 上 等 于 一 行 
所 占 的 字 节 数 X 位 图 高 度 。0090 0000 为 00009000h 二 80X90X2h 二 36864。 假 设 位 图 是 
24 位 , 宽 为 41, 高 为 30, 则 该 数值 = (biWidth * biBitCount 十 31)/32 x 4 x* biHeight, 即 一 
(41% 24 二 31)/32 x* 4x 30 一 3720。 

(13) 39 一 42: 水 平分 辩 率 ,像素 / 米 。AOOF 0000 为 0000 OFAOh 王 4000。 

(14) 43 一 46: 垂直 分 辩 率 ,像素 / 米 。AOOF 0000 为 0000 OFAOh 王 4000。 

(15) 47 一 50: 位 图 使 用 的 颜色 索引 数 。 设 为 0, 则 说 明 使 用 所 有 调 色 板 项 。 

(16) 51 一 54: 对 图 像 显示 有 重要 影响 的 颜色 索引 的 数目 。 若 为 0, 则 表示 所 有 颜色 都 重 


2.5.2 JPEG 文件 


JPEG 格式 是 一 种 常用 的 图 像 文 件 格式 ,其 文件 后 缀 名 为 . jpeg 或 . jpg, 它 是 Joint 
Photographic Experts Group( 联 合 图 像 专家 组 ) 的 英文 缩写 。JPEG 格式 是 一 个 比较 成 熟 的 
图 像 有 损 压 缩 格式 ,能 将 图 像 数 据 压缩 到 很 小 的 存储 空间 并 保持 较 好 的 图 像 质 量 。 也 就 是 
说 ,虽然 图 像 存储 为 JPEG 格式 会 有 一 些 信息 损失 ,但 人 眼 很 难 分 辨 出 压缩 前 后 图 像 质量 的 
差别 。JPEG 图 像 存 储 格式 既 满足 了 视觉 系统 对 色彩 和 分 辩 率 的 要 求 ,又 在 图 像 的 清晰 度 
和 文件 大 小 的 选择 上 找到 了 一 个 很 好 的 平衡 点 。 

JPEG 格式 是 一 种 灵活 的 图 像 文件 格式 ,具有 调节 图 像 质量 的 功能 , 它 允 许 采用 不 同 的 压 
缩 比 对 图 像 进行 压缩 。 根 据 对 图 像 质 量 的 要 求 ,JPEG 格式 的 压缩 比 通常 为 10 : 1 一 40 : 1。 
压缩 比 越 小 ,图 像 质量 越 高 ; 反之 ,压缩 比 越 高 ,图 像 质量 越 差 。JPEG 文件 被 压缩 的 数据 主 
要 是 高 频 信息 ,能 较 好 地 保护 低频 信息 ,同时 也 能 较 好 地 保护 彩色 信息 ,适应 于 连续 色调 的 
图 像 保存 。 

随 着 多 媒体 技术 的 应 用 越 来 越 广泛 ,传统 的 JPEG 压缩 算法 的 缺点 和 不 足 越 来 越 明 显 
地 表现 出 来 。 例 如 , 若 被 压缩 的 图 像 中 具有 大 片 近似 的 色彩 信息 时 ,用 JPEG 压缩 算法 就 容 
易 产生 马赛 克 效应 ,因此 , 当 对 图 像 的 质量 要 求 较 高 时 ,传统 的 JPEG 压缩 算法 可 能 达 不 到 
要 求 。 为 了 满足 新 的 应 用 需求 ,专家 组 对 JPEG 格式 进行 了 改进 ,推出 了 JPEG 2000 标准 ， 


中 
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新 的 压缩 算法 最 大 的 特点 是 将 传统 JPEG 压缩 算法 中 的 首选 DCT 算法 改 为 了 首选 小 波 变 
换 压 缩 算 法 。JPEG 2000 具有 以 下 4 个 特点 : 

(1) 压缩 比 高 。 与 传统 的 JPEG 压缩 算法 相 比 ,JPEG 2000 的 压缩 比 提高 了 20% 一 30% 。 

(2) 同时 支持 有 损 压 缩 和 无 损 压 缩 ,误差 稳定 性 好 ,图 像 的 质量 更 好 。 

(3) 渐进 传输 。 网 络 下 载 图 像 时 ,JPEG 2000 按 块 传输 ,有 助 于 快速 浏览 网 络 信息 , 提 
高 了 网 络 下 载 的 速度 。 

(4) 支持 感 兴趣 的 ROI, 能 制定 ROI, 可 单独 对 ROI 进行 压缩 和 解压 操作 。 

JPEG 图 像 文 件 结构 定义 了 一 些 列 标 记 用 于 区 分 和 识别 图 像 数 据 及 其 相关 信息 ,每 一 
个 标记 由 2 字 节 组 成 ,并 规定 前 一 个 字 节 是 0xFF ,每 个 标记 前 还 可 添加 若干 0xFF 字 节 , 且 
数量 不 限 。JPEG 格式 的 8 个 重要 标记 如 下 。 

(1) SOI 0xD8: 图 像 开 始 。 

(2) APP0 0xE0: APP0 段 主要 存储 图 片 的 识别 信息 (字符 串 *JFIF\0”) ,包括 APP0 的 
长 度 .标识 符 、 版 本 号 .X 和 YY 的 密度 单位 (units 为 0 表示 无 单位 ; units 为 1 表示 密度 单位 
为 “点 数 /英寸 ”; units 为 2 表示 密度 单位 为 “点 数 /cm”; ) ,X 方向 像素 密度 ,Y 方向 像素 密 
度 , 缩 略图 水 平 像素 数目 , 缩 略图 垂直 像素 数目 及 缩 略 图 RGB 位 图 信息 等 。 

(3) APPn 0xE1~0xEF: 其 他 应 用 数据 块 ,包括 APPn 的 长 度 等 信息 。 

(4) DQT 0XDB: 包括 量化 表 、 量 化 表 长 度 和 量化 表 数 目 等 。 颜 色 可 分 为 RGB 三 个 分 
量 ,但 在 JPEG 文件 的 RGB 色彩 格式 需要 先 转化 为 YUV 的 格式 。Y 分 量 代表 亮度 信息 ， 
UV 分量 代表 色差 信息 。 通 常人 眼 对 于 Y 分 量 更 为 敏感 ,量化 表 正 是 基于 这 一 原理 进行 
信息 压缩 的 。 

(5) SOF0 0xC0: 图 像 大 小 、 每 个 像素 的 位 数 及 YUYV 每 个 分 量 的 采样 信息 等 。 即 图 像 
数据 帧 的 开始 ,包括 帧 开始 长 度 与 精度 .每 个 颜色 分 量 、 像 素 位 数 、 图 像 高 度 与 宽度 .颜色 分 
量 数 、 每 个 颜色 分 量 的 ID 垂直 方向 的 样本 因子 水 平方 向 的 样本 因子 .量化 表 号 等 。 

(6) DHT 0xC4: 定义 Huffman 表 , 包 括 表 的 长 度 , 类 型 .直流 或 交流 量 表 、 索 引 、 位 表 
和 值 表 。 

(7) SOS 0xDA: 扫描 线 开 始 。 包 括 扫描 开始 长 度 .颜色 分 量 数 .直流 系数 表 号 .交流 系 
数 表 号 、 缩 略图 数据 等 。 

(8) EOI 0xD9: 图 像 全 部 数据 结束 。 

JPEG 文件 格式 更 深入 的 了 解 可 参考 第 9 章 中 关于 JPEG 标准 的 相关 介绍 。 


2.5.3 PNG 文件 


PNG 图 像 文件 存储 格式 即 可 移植 网 络 图 形 格式 (portable network graphic format， 
PNG) ,是 一 种 位 图 文件 (bitmap file) 存 储 格式 。PNG 用 于 存储 灰 度 图 像 时 , 灰 度 图 像 的 深 
度 可 达 16 位 ; 存储 彩色 图 像 时 ,彩色 图 像 的 深度 可 达 48 位 ,并 且 还 可 存储 多 到 16 位 的 a 
通道 数据 。PNG 采用 从 LZ77 派生 的 Zlib 无 损 数 据 压缩 算法 ,压缩 比 高 ,生成 文件 容量 小 ， 

般 应 用 于 Java 程序 或 网 页 。 

1. PNG 文件 的 特点 

PNG 文件 具有 以 下 特点 : 

(1) 体积 小 。 网 络 通信 中 因 带 宽 制 约 ,在 保证 图 片 清晰 、 逼 真 的 前 提 下 ,网 页 上 不 可 能 
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大 范围 地 使 用 文件 较 大 的 bmp 格式 文件 。 

(2) 无 损 压 缩 。PNG 文件 采用 L277 算法 的 派生 算法 进行 压缩 ,可 获得 高 的 压缩 比 。 
其 编码 方法 可 标记 重复 出 现 的 数据 ,因而 对 图 像 的 颜色 没有 影响 ,也 不 会 产生 颜色 的 损失 ， 
因此 可 以 重复 保存 而 不 降低 图 像 质量 。 

(3) 索引 彩色 模式 。PNG-8 格式 与 GIF 图 像 类 似 , 采 用 8 位 调 色 板 将 RGB 彩色 图 像 
转换 为 索引 彩色 图 像 。 图 像 中 保存 的 不 再 是 各 个 像素 的 彩色 信息 ,而 是 从 图 像 中 挑选 出 来 
的 具有 代表 性 的 颜色 编号 ,每 一 编号 对 应 一 种 颜色 ,图 像 的 数据 量 也 因此 减少 ,这 对 彩色 图 
像 的 传输 非常 有 利 。 

(4) 优化 的 网 络 传输 性 。PNG 图 像 在 浏览 器 上 采用 流 式 浏 览 ,图 像 即 使 经 过 交错 处 
理 , 在 完成 下 载 之 前 ,可 提供 一 个 基本 的 图 像 内 容 , 然 后 再 逐渐 显示 出 清晰 图 像 。 它 允许 连 
续 读 出 和 写 人 图 像 数 据 , 这 个 特性 很 适合 在 通信 过 程 中 显示 和 生成 图 像 。 

(5) 支持 透明 效果 。PNG 可 以 为 原 图 像 定义 256 个 透明 层次 ,使 得 彩色 图 像 的 边缘 能 
与 任何 背景 平滑 地 融合 ,从 而 彻底 地 消除 锯齿 边缘 ,这 一 功能 是 GIF 和 JPEG 没有 的 。 

(6) PNG 同时 还 支持 真 彩 和 灰 度 级 图 像 的 Alpha 通道 透明 度 。 

2. PNG 文件 结构 

PNG 文件 整体 上 由 PNG 文件 标志 (PNG file signature) 和 数据 块 (chunks) 两 部 分 构 
成 。 即 PNG 图 像 格 式 文 件 ( 或 者 称 为 数据 流 ) 由 一 个 8 字 节 的 PNG 文件 署名 域 和 按照 特 
定 结构 组 织 的 3 个 以 上 的 数据 块 组 成 。 文 件 的 数据 块 部 分 一 般 由 3 个 以 上 的 PNG 的 数据 
块 按照 特定 的 顺序 组 成 ,因此 ,一 个 标准 的 PNG 文件 结构 应 该 如 图 2-9 所 示 。 


PNG 文 件 标志 PNG 数据 块 … ”| PNG 数 据 块 ] 


Ma 


图 2-9 标准 的 PNG 文件 结构 


1) PNG 文件 标志 
PNG 文件 署名 域 由 8 字 节 的 数据 组 成 ,用 于 识别 该 文件 是 否 PNG 文件 。 该 域 的 值 如 


表 2-3 所 示 。 
表 2-3 PNG 文件 署名 域 的 值 
十 进 制 数 137 80 78 71 13 10 26 10 
十 六 进 制 数 | 89 50 4E 47 oD 0A 1A 0A 


其 中 第 一 个 字 节 0x89 超出 了 ASCII 字符 的 范围 ,这 是 为 了 避免 某 些 软件 将 PNG 文件 
当做 文本 文件 处 理 。 

2) PNG 数据 块 

PNG 定义 了 两 种 类 型 的 数据 块 : 一 种 称 为 关键 数据 块 (critical chunk) ,这 个 标准 数据 
块 是 必需 的 ; 另 一 种 称 为 辅助 数据 块 (ancillary chunks) ,是 可 选 数据 块 。 关 键 数据 块 定义 
了 4 个 标准 数据 块 ,每 个 PNG 文件 都 必须 包含 它们 ,PNG 读 写 软件 也 需 支 持 这 些 数据 块 。 
虽然 PNG 文件 规范 没有 要 求 PNG 编译 码 器 对 可 选 数据 块 进行 编码 和 译 码 ,但 规范 提倡 支 
持 可 选 数 据 块 。 

表 2-4 所 示 是 PNG 数据 块 类 别 ( 关 键 数据 块 部 分 用 深 色 背 景 加 以 区 分 ) 。 


表 2-4 PNG 文件 格式 中 的 数据 块 
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数据 块 符号 数据 块 名 称 多 数据 块 | 可 选 否 位 置 限 制 
IHDR 文件 头 数 据 块 否 否 第 一 块 
cHRM 基色 和 白色 点 数据 块 否 是 在 PLTE 和 IDAT 之 前 
gAMA 图 像 y 数据 块 否 是 在 PLTE 和 IDAT 之 前 
sBIT 样本 有 效 位 数据 块 否 是 在 PLTE 和 IDAT 之 前 
PLTE 调 色 板 数据 块 否 是 在 IDAT 之 前 
bKGD 背景 颜色 数据 块 否 是 在 PLTE 之 后 IDAT 之 前 
hIST 图 像 直 方 图 数据 块 否 是 在 PLTE 之 后 IDAT 之 前 
tRNS 图 像 透明 数据 块 否 是 在 PLTE 之 后 IDAT 之 前 
oFFs (专用 公共 数据 块 ) 否 是 在 IDAT 之 前 
pHYs 物理 像素 尺寸 数据 块 否 是 在 IDAT 之 前 
sCAL (专用 公共 数据 块 ) 否 是 在 IDAT 之 前 
IDAT 图 像 数据 块 是 否 与 其 他 IDAT 连续 
tIME 图 像 最 后 修改 时 间 数 据 块 否 是 无 限制 
tEXt 文本 信息 数据 块 是 是 无 限制 
zTXt 压缩 文本 数据 块 是 是 无 限制 
{RAc (专用 公共 数据 块 ) 是 是 无 限制 
gIFg (专用 公共 数据 块 ) 是 是 无 限制 
gIFt (专用 公共 数据 块 ) 是 是 无 限制 
gIFx (专用 公共 数据 块 ) 是 是 无 限制 
IEND 图 像 结 束 数据 否 否 最 后 一 个 数据 块 


为 简单 和 方便 ,假设 在 本 节 所 使 用 的 PNG 图像 文 件 中 ,这 4 个 数据 块 按 表 2-4 所 示 的 
先后 顺序 进行 存储 ,并 且 只 出 现 一 次 。 
(1) 数据 块 结构 。PNG 文件 中 ,每 个 数据 块 由 4 个 部 分 组 成 ,如 表 2-5 所 示 。 


表 2-5 PNG 数据 块 的 结构 


名 称 字 节 数 说 明 
Length (长 度 ) 4 指定 数据 块 中 数据 域 的 长 度 ,长 度 不 超过 (2?2 一 1) 字 节 
Chunk Type Code( 数 据 块 类 型 码 ) 4 数据 块 类 型 码 由 ASCII 字 母 (A 一 Z 和 a~z) 组 成 
Chunk Data (数据 块 数据 ) 可 变 存储 按照 Chunk Type Code 指定 的 数据 
CRC (循环 元 余 检 测 ) 4 存储 用 于 检测 是 否 有 错误 的 循环 元 余 码 


CRC(cyclic redundancy check) 域 中 的 数据 是 对 chunk type code 域 和 chunk data 域 中 
的 数据 进行 计算 得 到 的 ,CRC 算法 在 ISO 3309 和 ITU-T V. 42 中 定义 。 

(2) IHDR。 文 件 头 数据 块 IHDR(header chunk) 包 含有 PNG 文件 中 存储 的 图 像 数据 
的 基本 信息 ,并 作为 第 一 个 数据 块 出 现在 PNG 数据 流 中 ,而 且 一 个 PNG 数据 流 中 只 能 有 
一 个 文件 头 数据 块 。 

文件 头 数 据 块 由 13 字 节 组 成 , 它 的 格式 如 表 2-6 所 示 。 
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表 2-6 文件 头 数据 块 的 组 成 


域 的 名 称 字 节 数 说 明 
Width 4 图 像 宽度 ,以 像素 为 单位 
Height 4 图 像 高 度 , 以 像素 为 单位 
图 像 深度 : 
索引 彩色 图 像 : 1.2.4 或 8 
esi 】 | 灰 度 图 像 : 1.2.4.8 或 16 
真 彩色 图 像 : 8 或 16 
颜色 类 型 : 
0: 灰 度 图 像 , 1.2、4、8 或 16 
2: 真 彩色 图 像 ,8 或 16 
2 | 3: 索引 彩色 图 像 ,1.2.4 或 8 
4: 带 a 通道 数据 的 灰 度 图 像 ,8 或 16 
6: 带 a 通道 数据 的 真 彩 色 图 像 ,8 或 16 
Compression method 和 压缩 方法 (LZ77 派生 算法 ) 
Filter method 1 滤波 器 方法 
隔行 扫描 方法 : 
TInterlace method L 0: 非 隔行 扫描 
1: Adam7( 由 Adam M. Costello 开发 的 7 遍 隔行 扫描 方法 ) 


(3) PLTE。 调 色 板 数据 块 PLTE(palette chunk) 包 含 与 索引 彩色 图 像 (indexed-color 
image) 相 关 的 彩色 变换 数据 , 它 仅 与 索引 彩色 图 像 有 关 , 而 且 应 置 于 图 像 数 据 块 (image 
data chunk) 之 前 。 
PLTE 数据 块 是 定义 图 像 的 调 色 板 信息 ,PLTE 可 以 包含 1 一 256 个 调 色 板 信息 ,每 一 
个 调 色 板 信息 由 3 个 字 节 组 成 ,如 表 2-7 所 示 。 
表 2-7 调 色 表 信 息 表 


颜 色 字 池 元 意 基 
Red 1 0 二 黑色, 255= 二 红色 
Green 1 0 一 黑色 ,255 一 绿色 
Blue 1 0 一 黑色 ,255 一 蓝 色 


因此 , 调 色 板 的 长 度 是 3 的 倍数 ,否则 是 一 个 非法 的 调 色 板 。 对 于 索引 图 像 , 调 色 板 信 
息 是 必须 的 , 调 色 板 的 颜色 索引 从 0 开始 编号 ,然后 是 1 .2…… 调 色 板 的 颜色 数 不 能 超过 
色 深 中 规定 的 颜色 数 ( 如 图 像 色 深 为 4, 调 色 板 的 颜色 数 为 16) ,否则 将 导致 PNG 图 像 不 
合法 。 

真 彩色 图 像 和 带 a 通道 数据 的 真 彩色 图 像 也 可 以 有 调 色 板 数 据 块 ,目的 是 便于 非 真 彩 
色 显 示 程 序 用 它 来 量化 图 像 数 据 ,从 而 显示 该 图 像 。 

(4) IDAT。 图 像 数 据 块 IDAT(image data chunk) 用 于 存储 PNG 图 像 的 灰 度数 据 ,在 
数据 流 中 可 包含 多 个 连续 顺序 的 图 像 数据 块 。 

(5) IEND。 图 像 结束 数据 IEND(image trailer chunk) 用 于 标记 PNG 文件 或 者 数据 流 
已 经 结束 ,并 且 必 须 放 在 文件 的 尾部 。PNG 文件 总 是 以 “00 00 00 00 49 45 4E 44 AE 42 60 


第 2 章 ”数字 图 像 处 理 基础 和 35 


82”12 个 字符 结束 。 这 是 因为 根据 数据 块 结构 的 定义 ,IEND 数据 块 的 长 度 总 是 0(00 00 00 
00) ,数据 标识 为 IEND(49 45 4E 44) ,因此 ,CRC 码 是 AE 42 60 82。 


2.5.4 TIFF 文件 


TIFF 即 标签 图 像 文件 格式 (tagged image file format) ,以 . tif 为 扩展 名 ,是 一 种 主要 
于 存储 包括 照片 和 艺术 图 片 在 内 的 图 像 的 文件 格式 。 它 最 初 由 Aldus 和 微软 一 起 为 
PostScript 打印 而 开发 。TIFF 格式 支持 256 色 、24 位 真 彩色 、32 位 、48 位 等 多 种 色彩 位 , 同 
时 支持 RGB、CMYK 及 YCbCr 等 多 种 彩色 模式 ,并 支持 多 平台 。TIFF 文件 可 以 不 压缩 
(文件 较 大 ) 也 可 以 压缩 ,支持 RAW、RLE、LZW、JPEG、CCITT 3 组 和 4 组 等 多 种 压缩 方 
式 , 用 Photoshop 编辑 的 TIFF 文件 可 以 保存 路 径 和 图 层 , 绝 大 多 数 图 像 系 统 都 支持 这 种 
格式 。 

TIFF 在 业界 得 到 了 广泛 的 支持 ,如 Adobe 公司 的 Photoshop、Jasc 的 GIMP,、 Ulead 
PhotoImpact 和 Paint Shop Pro 等 图 像 处 理应 用 .QuarkXPress 和 Adobe InDesign 桌面 印 
刷 和 页 面 排版 应 用 ,扫描 、\ 传 真 ,. 文 字 处 理光 学 字符 识别 和 一 些 其 他 应 用 等 都 支持 该 格式 。 
TIFF 与 JPEG 和 PNG 一 起 成 为 流行 的 高 位 彩色 图 像 格式 ,TIFF 文件 是 最 复杂 的 一 种 位 
图 文件 格式 , 它 广 泛 应 用 于 对 图 像 质量 要 求 较 高 的 图 像 存储 与 转换 。 由 于 TIFF 格式 结构 
灵活 ` 包 容 性 大 ,因此 已 成 为 图 像 文件 格式 的 一 种 标准 。 

TIFF 最 初 的 目的 是 为 20 世纪 80 年 代 中 期 桌面 扫描 仪 厂商 避免 每 商家 都 使 用 自己 的 
格式 而 达成 的 一 个 公用 统一 的 扫描 图 像 文件 格式 。 当 时 的 桌面 扫描 仪 只 能 处 理 二 值 图 像 ， 
因此 初期 TIFF 也 只 是 二 值 图 像 格式 , 随 着 扫描 仪 的 功能 越 来 越 强 大 ,TIFF 逐渐 支持 灰 度 
图 像 和 彩色 图 像 。 

1. TIFF 文件 结构 

TIFF 文件 数据 格式 由 图 像 文件 头 、 图 像 文件 目录 、 目 录入 口 和 图 像 数 据 4 个 部 分 组 
成 ,如 图 2-10 所 示 。 


图 像 文件 图 像 文 件 目录 
字 节 序列 项 数 
I 最 高 有 效 位 的 最 小 值 0 项 
MM 最 低 有 效 位 的 最 大 值 1 项 
版 本 号 2 项 
第 一 个 IFD 的 偏 移 量 
4-1 项 
目录 入 口 下 一 个 IFD 的 偏 移 量 
Tag 
数据 字 节 
数据 长 度 
距 2 值 的 偏 移 量 2Z 值 (TIFF 图 像 数据 ) 


图 2-10 TIFF 文件 格式 的 结构 
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TIFF 文件 的 应 用 非常 广泛 ,这 是 因为 : 

(1) TIFF 可 以 描述 多 种 类 型 的 图 像 。 

(2) TIFF 拥有 一 系列 的 压缩 方案 可 供 选 择 。 

(3) TIFF 不 依赖 于 具体 的 硬件 。 

(4) TIFF 是 一 种 可 移植 的 文件 格式 。 

(5) TIFF 是 一 种 主要 的 压缩 方法 。 

(6) 多 种 色彩 表示 方法 。 

2. 文件 头 

每 一 个 TIFF 文件 的 第 一 个 数据 结构 称 为 图 像 文件 头 (image file header,IFH) , 它 是 图 
像 文件 体系 结构 的 最 高 层 。 文 件 头 部 分 共 8 字 节 ,格式 如 图 2-11 所 示 。 


1WMM (表示 字 节 序 ， 共 2 字 节 ) 42 (版 本 号 ， 共 2 字 节 ) 


| 文件 目录 在 整个 文件 的 偏 移 量 ， 是 一 个 指针 ， 指 向 IFD 的 开始 部 分 (4 字 节 ) 


2-11 文件 头 格式 


这 个 结构 在 一 个 TIFF 文件 中 是 唯一 的 ,有 固定 的 位 置 ,位 于 文件 的 开始 部 分 ,包含 了 
正确 解释 TIFF 文件 其 他 部 分 所 需 的 必要 信息 。 

3. 文件 目录 

文件 目录 (image file directory,IFD) 是 TIFF 文件 的 第 2 个 数据 结构 ,包含 了 文件 的 重 
要 信息 , 即 IFD 提供 了 一 系列 的 指针 ,这 些 指 针 包 含 了 各 种 有 关 的 数据 字段 在 文件 中 的 开 
始 位 置 ,并 给 出 每 个 字段 的 数据 类 型 及 长 度 。 其 格式 如 图 2-12 所 示 。 

一 个 TIFF 图 像 可 有 多 个 IFD, 说 明 该 文件 有 多 幅 图 像 。 每 一 个 标记 一 幅 图 像 的 基本 
属性 。IFD 结构 包含 3 个 成 员 , 其 中 项 数 (directory entry count) 占 2 字 节 ,指出 该 结构 有 多 
少 个 目录 入 口 ; 随后 是 线性 排列 的 Directory Entry 序列 ,数量 不 定 ,这 就 是 TIFF 文件 称 为 
可 扩充 标记 的 文件 的 原因 ,用 户 甚 至 可 以 添加 自 定 义 的 标记 属性 ,每 一 个 directory entry 标 
记 了 图 像 的 某 一 属性 ; 最 后 一 个 成 员 是 偏 移 量 ,标记 下 一 个 文件 目录 相对 于 文件 开始 处 的 


位 置 。 
IFD 的 总 项 数 (2 字 节 ) 项 1(12 字 节 ) 
项 2 … (12 字 节 ) 
下 一 个 IFD 的 开始 地 址 (用 于 保存 多 个 文件 ) 
2-12 文件 目录 格式 
4. 目录 入 口 
每 个 目录 入 口 (directory entry,DE) 共 由 12 字 节 组 成 ,格式 如 图 2-13 所 示 。 
Tag (2 字 节 ) Tag 的 数据 类 型 
数据 长 度 
数据 值 或 值 的 偏 移 (文件 范围 ) 


图 2-13 目录 入 口 格式 
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个 DE 就 是 一 幅 图 像 的 某 一 属性 , 它 包 含 图 像 的 大 小 ,分辩 率 、 压 缩 信息 、 像 素 的 行 与 
列 数 量 、 每 一 像素 由 几 位 表示 (1 表示 二 值 图 像 ,8 代表 256 色 ) 等 。 目 录入 口中 的 Tag 成 员 
是 该 属性 的 编号 ,编号 按 升序 排列 。 第 2 个 成 员 是 数据 类 型 ,共有 5 种 数据 类 型 。 第 3 个 成 
员 是 数据 的 长 度 ,第 4 个 成 员 是 到 2Z 值 的 偏 移 量 ,是 指 Tag 标识 的 代表 的 变量 值 相对 于 文 
件 开始 处 的 偏 移 量 ,如 果 该 值 小 于 4 字 节 , 则 直接 将 该 值 存放 即 可 。 

5. 图 像 数据 

根据 IFD 所 指向 的 地 址 , 紧 随 上 述 数 据 之 后 就 是 图 像 数 据 ; 图 像 数 据 的 存储 形式 有 不 
同 的 方式 。TIFF-B 用 于 二 值 图 像 ,TIFF-G 用 于 灰 度 图 像 ,TIFF-P 用 于 带 调 色 板 的 图 像 ， 
TIFF-R 用 于 RGB 真 彩色 图 像 。 

TIFF 文件 格式 适 于 在 应 用 程序 之 间 和 计算 机 平台 之 间 的 文件 交换 , 它 的 出 现 使 得 图 
像 数 据 交 换 变 得 简单 。TIFF 是 一 个 灵活 适应 性 强 的 文件 格式 ,通过 在 文件 头 中 包含 “ 标 
签 " 它 能 够 在 一 个 文件 中 处 理 多 幅 图 像 和 数据 。 标 签 能 够 标明 图 像 的 大 小 或 定义 图 像 数 据 
如 何 排列 及 是 否 使 用 压缩 选项 。 如 TIFF 可 以 包含 JPEG 和 行程 长 度 编码 压缩 的 图 像 。 
TIFF 文件 也 可 包含 基于 矢量 的 裁剪 区 域 ( 剪 切 或 者 构成 主体 图 像 的 轮廓 )。 使 用 无 损 格式 
存储 图 像 的 能 力 使 TIFF 文件 成 为 图 像 存档 的 有 效 方法 。 与 JPEG 不 同 ,TIFF 文件 可 以 编 
辑 然后 重新 存储 而 不 会 有 压缩 损失 。 

每 个 TIFF 文件 都 是 从 指示 字 节 顺序 的 两 个 字 节 开始 的 。II 表示 小 字 节 在 先 ,MM 表 
示 大 字 节 在 先 。 后 面 两 个 字 节 表示 数字 42。42 的 读 取 方法 取决 于 头 两 个 字 节 所 表示 的 字 
节 顺 序 。 整 个 文件 根据 所 指出 的 字 节 顺序 进行 读 取 。 

TIFF 的 最 大 局 限 在 于 用 4byte 表示 偏 移 量 ,这 样 导致 文件 大 小 的 上 限 为 4GB。 在 20 年 前 
制定 TIFF 标准 时 4GB 足够 大 ,但 现在 却 成 了 制约 TIFF 的 一 个 瓶颈 。 目 前 BigTIFF 已 经 提 
出 用 8 个 字 节 来 表示 偏 移 量 。 这 样 数据 量 应 该 足够 大 了 。 此 外 ,TIFF 文件 的 复杂 性 给 它 
的 应 用 带 来 了 一 些 问 题 。 


2.5.5 ”GIF 文件 


GIF(graphics interchange format) 即 图 像 互 换 格式 ,是 CompuServe 于 1987 年 开发 出 
来 的 图 像 文件 格式 。GIF 文件 的 数据 采用 了 一 种 基于 LZW 算法 的 连续 色调 的 无 损 压 缩 格 
式 , 允 许 用 户 为 图 像 设 置 背 景 的 透明 属性 ,其 压缩 率 一 般 在 50% 左 右 , 它 不 属于 任何 应 用 程 
序 。 目 前 几乎 所 有 相关 软件 都 支持 GIF ,GIF 图 像 文件 是 一 种 在 网 络 上 非常 流行 的 图 形 文 
件 格式 。GIF 图 像 文件 格式 的 特点 之 一 是 数据 是 经 过 压缩 的 ,其 采用 的 是 可 变 长 度 压 缩 算 
法 。GIF 格式 的 另 一 个 特点 是 其 在 一 个 GIF 文件 中 可 以 存 多 幅 彩 色 图 像 , 若 将 存储 在 一 个 
文件 中 的 多 幅 图 像 数 据 逐 幅 读 出 并 显示 到 屏幕 上 ,就 可 构成 一 种 最 简单 的 动画 。 

GIF 格式 由 CompuServe 引入 应 用 后 , 因 其 体积 小 和 成 像 相 对 清晰 ,在 早期 的 互联 网 上 
大 受 欢迎 。GIF 文件 采用 无 损 压 缩 技术 ,对 于 256 色 以 内 的 图 像 , 则 可 既 减少 文件 的 大 小 ， 
又 保持 图 像 的 质量 。GIF 图 像 是 基于 颜色 列表 的 (存储 的 数据 是 该 点 颜色 对 应 于 颜色 表 的 
索引 值 ) ,最 多 支持 8 位 (256 色 ) 。GIF 文件 内 部 分 成 许多 存储 块 ,用 于 存储 多 幅 图 像 或 者 
是 决定 图 像 表现 行为 的 控制 块 , 用 以 实现 动画 和 交互 式 应 用 。 

GIF 主要 分 为 两 个 版 本 , 即 GIF 89a 和 GIF 87a。 

(1) GIF87a: 1987 年 制定 的 版 本 。 


38 大 | 数字 图 像 处 理 及 应 用 一 一 使 用 MATLAB 分 析 与 实现 


(2) GIF89a: 1989 年 制定 的 版 本 。 在 该 版 本 中 ,为 GIF 文档 扩充 了 图 形 控制 区 块 、 备 
注 说明、 应 用 程序 编程 接口 等 四 个 区 块 , 并 提供 了 对 透明 色 和 多 帧 动画 的 支持 。 

GIF 文件 内 部 是 按 块 划分 的 ,包括 控制 块 和 数据 块 两 种 。 控 制 块 控 制 数据 块 的 行为 ,不 
同 的 控制 块 包含 不 同 的 控制 参数 。 数 据 块 只 包含 一 些 8bit 的 字符 流 , 由 它 前 面 的 控制 块 来 
决定 它 的 功能 ,数据 块 长 度 为 0 一 255 字 节 ,数据 块 的 第 一 个 字 节 是 该 数据 块 的 长 度 , 计 算数 
据 块 的 长 度 时 不 包括 这 个 字 节 ,所 以 一 个 空 的 数据 块 也 有 一 个 字 节 , 那 就 是 数据 块 的 大 小 
&.H00。 控 制 块 中 的 逻辑 屏幕 描述 块 和 全 局 彩色 表 的 作用 范围 是 整个 数据 流 ,其 他 控制 块 
仅 控 制 跟 在 它们 后 面 的 图 形 描述 块 。 一 个 GIF 文件 的 结构 可 分 为 文件 头 (file hearder)、 
GIF 数据 流 (GIF data stream) 和 文件 结束 块 (trailer) 三 个 部 分 。GIF 文件 的 典型 结构 如 


表 2-8 所 示 。 
表 2-8 GIF 文件 的 基本 结构 
序 号 结构 名 称 下 人 辣 实 长 度 / 字 节 
1 Header GIF 文件 头 6 
2 Logical Screen Descriptor 逻辑 屏幕 描述 块 7 
3 Global Color Table 全 局 彩色 表 768 
扩展 模块 ( 任 选 ) 
4 Image Descriptor 像 描 述 块 10 
5 Local Color Table 局 部 彩色 表 ( 可 重复 nn 次 ) 768 
6 Table Based Image Data 表 基 图 像 数 据 
yi Graphic Control Extension 图 形 控 制 扩展 块 8 
8 Plain Text Extension 无 格式 文本 扩展 块 
9 Comment Extension 注释 扩展 块 4 一 258 
10 Application Extension 应 用 程序 扩展 块 
扩展 模块 ( 任 选 ) 
项 GIF Trailer 文件 结束 块 1 


根据 表 2-8 所 示 的 基本 结构 ,对 GIF 文件 详 述 如 下 。 

1. GIF 文件 头 

GIF 文件 头 描 述 块 定 义 GIF 数据 流 ,文件 头 由 GIF 标记 域 (signature) 和 版 本 号 
(version) 域 组 成 ,是 一 个 由 6 个 固定 字 节 组 成 的 数据 块 ,它们 用 来 说 明 使 用 的 文件 是 GIF 
格式 及 当前 的 版 本 号 ,标志 域 和 版 本 域 各 占 3 字 节 。GIF 标记 域 存放 的 是 GIF ,版 本 号 域 存 
放 的 是 1987 年 5 月 发 布 的 87a 或 1989 年 7 月 发 布 的 89a, 或 更 新 的 版 本 号 。 

GIFHEADER 结构 定义 如 下 : 


typedef struct gifheader 
{ 
BYTE bySignature[3]; 
BYTE byVersion[3]; 
}GIFHEADER; 


2. 逻辑 屏幕 描述 块 
逻辑 屏幕 描述 块 (logical screen descriptor) 包 含 定义 图 像 显示 区 域 的 参数 ,包括 背景 颜 
色 信 息 。 这 个 数据 块 中 的 坐标 是 相对 于 虚拟 屏幕 的 左上 和 角 开 始 的 ,不 一 定 是 指 显示 屏 的 绝 
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对 坐标 ,因此 可 以 参照 窗口 软件 环境 下 的 窗口 坐标 或 者 打印 机 坐标 来 设计 图 像 显 示 程 序 。 
逻辑 屏幕 描述 块 的 结构 如 表 2-9 所 示 。 
表 2-9 逻辑 屏幕 描述 块 的 结构 
7| 净 | 意 | 妇 | 多 |1T|0| 字 菠 号 域 的 名 称 类 型 
Logical Screen 0 逻辑 屏幕 宽度 unsigned 
| 以 像素 为 单位 
Logical Screen 2 逻辑 屏幕 高 度 unsigned 
3 以 像素 为 单位 
G CR S Size 4 包装 域 
Background Color Index 5 背景 颜色 索引 Byte 
Pixel Aspect Ratio 6 像素 宽 高 比 Byte 


GIFSCRDESC 结构 定义 如 下 : 


typedef struct gifscrdesc 
{ 
WORD wWidth; 
WORD wDepth; 
struct globalflag 
{ 
BYTE PalBits: 3; 
BYTE SortFlag: 1; 
BYTE ColorRes: 3; 
BYTE GlobalPal: 1; 
} 
GlobalFlag; 
BYTE byBackground; 
BYTE byAspect; 

}GIFSCRDESC; 

逻辑 屏幕 描述 块 包含 7 字 节 。 字 节 0 和 字 节 1 用 于 说 明 逻 辑 显示 屏 的 宽度 , 字 节 2 和 
字 节 3 用 于 说 明 逻 辑 显 示 屏 的 高 度 , 字 节 4 用 于 描述 彩色 表 的 属性 , 字 节 5 用 于 指定 背景 颜 
色 索 引 , 字 节 6 用 于 计算 像素 的 宽 高 比 。 相 关 细节 详 述 如 下 。 

(1) 屏幕 描述 块 中 的 第 5 个 字 节 称 为 包装 域 (packed fields) , 它 由 4 个 子 域 组 成 : 

@ 全 局 彩色 表 标 志 (global color table flag ) 域 G 用 来 说 明 是 否 有 全 局 彩色 表 存 在 。 若 
G=1, 表 示 有 一 个 全 局 彩色 表 将 紧 跟 在 这 个 逻辑 屏幕 描述 块 之 后 ; 这 个 标志 也 用 于 选择 背 
景 颜 色 索 引 (background color index) 。 如 果 G 一 1 ,背景 颜色 索引 域 中 的 值 就 用 作 背 景 颜色 
的 索引 。 

@ 彩色 分 辩 率 (color resolution) 域 CR 用 于 表示 原始 图 像 可 用 的 每 种 基色 的 位 数 ( 实 
际 值 减 1) 。 这 个 位 数 表示 整个 调 色 板 的 大 小 ,而 不 是 这 幅 图 像 使 用 的 实际 颜色 数 。 若 该 域 
的 值 CR 二 3, 说 明 原始 图 像 可 用 每 个 基色 有 4 位 的 调 色 板 来 生成 彩色 图 像 。 

@ 彩色 表 排序 标志 (sort flag) 域 S 用 于 表示 全 局 彩色 表 中 的 颜色 是 否 按 重要 性 (或 使 
用 率 ) 排 序 。 若 S=0, 表 示 没 有 重要 性 排序 ; 若 S=1, 表 示 最 重要 的 颜色 排 在 前 。 这 样 做 的 
目的 是 辅助 颜色 数 比 较 少 的 解码 器 能 够 选择 最 好 的 颜色 子 集 , 在 这 种 情况 下 解码 器 就 可 选 
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择 彩 色 表 中 开始 段 的 彩色 来 显示 图 像 。 

@ 全 局 彩色 表 大 小 (size of global color table) 域 Size 表示 每 个 像素 的 位 数 , 它 用 于 计 
算 全 局 彩色 表 中 包含 的 字 节 数 。 在 全 局 彩色 表 标 志 域 G 一 0 时 就 不 用 计算 ,G 二 1 时 就 需 计 
算 彩 色 表 的 大 小 ,具体 计算 参考 本 节 全 局 彩色 表 。 

(2) 屏幕 描述 块 中 的 第 6 个 字 节 是 背景 颜色 索引 , 它 是 彩色 表 的 一 个 索引 值 , 用 于 指定 
背景 颜色 。 若 全 局 彩色 表 标 志 域 G 一 0, 这 个 域 的 值 也 设置 为 0。 

(3) 像素 宽 高 比 (pixel aspect ratio) 域 中 的 值 是 一 个 因数 ,是 计算 原始 图 像 像 素 的 宽 高 
比 的 一 个 近似 值 。 该 域 的 值 范 围 为 1 一 255。 若 该 值 不 等 于 0, 则 宽 高 比 的 近似 值 按 下 式 
计算 : 


Aspect Ratio= (Pixel Aspect Ratio 十 15)/64 

像素 宽 高 比 定义 成 像素 的 宽度 与 高 度 之 比 ,比值 的 范围 在 4: 1~1 : 4 之 间 , 其 增 量 为 
1/64。 

3. 全 局 彩色 表 

由 于 一 个 GIF 文件 可 以 包含 多 幅 彩 色 图 像 ,每 幅 彩 色 图 像 也 许 都 包含 适合 自身 特点 的 
彩色 表 , 因 此 一 个 GIF 文件 可 以 有 好 几 个 彩色 表 。 但 归纳 起 来 具有 两 类 : 全 局 彩色 表 和 局 
部 彩色 表 。 全 局 彩色 表 可 用 于 图 像 本 身 没有 带 彩色 表 的 所 有 图 像 和 无 格式 文本 扩展 块 
(plain text extension) 图 像 ,而 局 部 彩色 表 只 用 于 紧 跟 在 它 后 面 的 一 幅 图 像 。 在 处 理 全 局 彩 
色 表 和 局 部 彩色 表 时 需要 注意 如 下 规则 。 

(1) 如 果 GIF 文件 包含 全 局 彩色 表 , 而 且 要 显示 的 图 像 本 身 又 带 有 局 部 彩色 表 , 则 显示 
该 幅 彩 色 图 像 时 就 用 自 有 的 彩色 表 , 而 不 用 全 局 彩色 表 。 在 这 种 情况 下 ,解码 器 就 首先 保存 
全 局 彩色 表 , 然 后 使 用 局 部 彩色 表 显 示 图 像 ,最 后 再 恢复 全 局 彩色 表 。 

(2) 全 局 彩色 表 和 局 部 彩色 表 都 是 可 选 的 。 基 于 此 ,解码 器 最 好 要 保存 全 局 彩色 表 直 
到 出 现 另 一 个 全 局 彩色 表 为 止 。 这 样 ,对 于 包含 完全 没有 彩色 表 的 一 幅 或 者 多 幅 彩 色 图 像 
的 GIF 文件 就 可 以 使 用 最 后 保存 的 全 局 彩色 表 进 行 处 理 。 

(3) 如 果 同 类 型 的 图 像 能 够 使 用 相同 的 彩色 表 来 显示 ,编码 器 就 要 尽 可 能 使 用 一 个 全 
局 彩色 表 ; 如 果 没 有 彩色 表 可 用 ,解码 器 就 可 以 使 用 计算 机 系统 提供 的 彩色 表 或 者 解码 器 
自身 的 彩色 表 。 

(4) 全 局 彩色 表 是 否 存 在 由 他 辑 屏 幕 描述 块 中 第 5 字 节 的 全 局 彩色 表 标 志 域 G 的 值 确 
定 ,车 存在 ,彩色 表 就 紧 跟 在 逻辑 屏幕 描述 块 之 后 。 

4. 图 像 描 述 块 

GIF 图 像 文 件 格式 可 包含 多 幅 图 像 ,而 且 无 固定 存放 顺序 , 仅 用 一 个 字 节 图 像 分 隔 符 
(image separator) 来 判断 是 否 为 图 像 描述 块 。 每 一 幅 图 像 都 由 一 个 图 像 描 述 块 .局 部 彩色 
表 ( 该 表 可 以 没有 ) 和 图 像 数 据 组 成 。 每 幅 图 像 必须 在 逻辑 屏幕 描述 块 中 定义 的 逻辑 屏 尺 寸 
范围 内 。 图 像 描述 块 之 前 可 以 有 一 个 或 者 多 个 控制 块 ,如 图 形 控制 扩展 块 之 后 可 有 一 个 局 
部 彩色 表 。 无 论 前 后 是 否 有 各 种 数据 块 , 图 像 描 述 块 总 是 带 有 图 像 数据 。 图 像 描述 块 的 结 
构 如 下 。 

typedef struct gifimage 


{ 
WORD wLeft; 
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WORD wTop; 
WORD wWidth; 
WORD wDepth; 
struct localflag 
| BYTE PalBits : 3; 
BYTE Reserved : 2; 
BYTE SortFlag : 1; 
BYTE Interlace:1; 
BYTE LocalPal : 1; 
} LocalFlag; 

} GIFIMAGE,; 

图 像 描述 块 的 第 9 个 字 节 称 为 包装 域 (packed fields) 字 节 , 它 由 5 个 子 域 组 成 : 

(1) 局 部 彩色 表 标 志 域 L 用 于 说 明 是 否 有 局 部 彩色 表 存 在 。 如 果 L= 二 1, 表 示 有 一 个 局 
部 彩色 表 将 紧 跟 在 这 个 图 像 描 述 块 之 后 ; 如 果 G=0, 表 示 图 像 描述 块 后面 没 有 局 部 彩色 
表 , 该 图 像 将 使 用 全 局 彩色 表 。 

(2) 交 插 显 示 标 志 (interlace flag) 域 I 用 于 表示 该 图 像 是 不 是 交 捅 图 像 Cinterlaced 
images) 。 如 果 I 二 0, 表 示 该 图 像 不 是 交 插图 像 : 如 果 I 二 1, 表 示 该 图 像 是 交 插图 像 。 使 用 
该 位 标志 可 知道 图 像 数 据 是 如 何 存放 的 。GIF 文件 格式 定义 了 两 种 数据 存储 方式 : 一 种 是 
按 图 像 行 连续 顺序 存储 ,这 个 顺序 与 显示 器 上 显示 行 的 顺序 相同 ; 另 一 种 按 交 插 方式 存储 。 
交 插 图 像 按 行 分 成 如 下 所 示 的 4 组 : 

Q@ Group 1: 每 隔 8 行 组 成 一 组 ,从 第 0 行 开始 显示 /第 1 遍 交 捅 。 

@ Group 2: 每 隔 8 行 组 成 一 组 ,从 第 4 行 开 始 显示 /第 2 遍 交 捅 。 

@ Group 3: 每 隔 4 行 组 成 一 组 ,从 第 2 行 开始 显示 /第 3 遍 交 插 。 

@ Group 4: 每 隔 2 行 组 成 一 组 ,从 第 1 行 开始 显示 /第 4 遍 交 插 。 

显示 图 像 需 要 较 长 的 时 间 ,使 用 这 种 方法 存放 和 显示 图 像 数 据 可 以 在 图 像 显 示 完 成 之 
前 看 到 这 幅 图 像 的 概貌 ,而 不 觉得 显示 时 间 长 。 

(3) 彩色 表 排序 标志 域 的 含义 与 全 局 彩色 表 中 域 的 含义 相同 。 

(4) 保留 (reserved) 。 

(5) 局 部 彩色 表 大 小 域 的 值 用 于 计算 局 部 彩色 表 中 所 包含 的 字 节 数 。 

5. 局 部 彩色 表 

局 部 彩色 表 用 于 紧 跟 在 它 后 面 的 图 像 。 彩 色 表 是 否 存在 取决 于 图 像 描述 块 中 局 部 彩色 
表 标 志 位 的 设置 ,彩色 表 的 结构 和 大 小 与 全 局 彩色 表 完 全 相同 。 

6. 表 基 图 像 数据 

GIF 图 像 采 用 了 LZW 算法 对 图 像 数 据 进 行 压缩 。 为 提高 压缩 编码 的 效率 ,对 LZW 编 
码 器 输出 的 代码 采用 可 变 长 度 码 VLC。 表 基 图 像 数 据 (table based image data) 由 LZW 最 
小 代码 长 度 和 图 像 数 据 组 成 ,LZW 最 小 代码 长 度 域 的 值 用 于 确定 图 像 数据 中 LZW 代码 使 
用 的 初始 位 数 。 图 像 数据 由 数据 子 块 (data sub-blocks) 序 列 组 成 。 数 据 子 块 的 结构 是 一 个 
可 变 长 度 的 数据 块 ,其 长 度 由 块 大 小 域 (block size) 域 中 的 值 确定 , 字 节 数 为 0 一 255。 

7. 图 形 控 制 扩展 块 
图 形 控制 扩展 块 (graphic control extension) 包 含 处 理 图 形 描绘 块 时 需 使 用 的 参数 , 它 
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的 结构 说 明 如 下 : 
(1) 扩展 导入 符 (extension introducer) 用 于 识别 扩展 块 的 开始 , 域 中 的 值 是 一 个 数值 等 
于 0x21 的 固定 值 。 


(2) 图 形 控制 标签 用 于 标识 当前 块 是 一 个 图 形 控制 扩展 块 , 域 中 的 值 是 一 个 数值 等 于 
0xF9 的 固定 值 。 

(3) 块 大 小 (block size) 用 于 说 明 该 扩展 块 所 包含 字 节 数 ,该 字 节 数 是 从 这 个 块 大 小 域 
之 后 到 块 结束 符 之 间 的 字 节 数 。 控 制 块 数据 结果 如 下 : 


typedef struct gifcontrol 
{ 
BYTE byBlockSize; 
struct flag 
{ 
BYTE Transparency :1; 


BYTE UserInput ss 

BYTE DisposalMethod:3; 

BYTE Reserved :38 
}Flag; 


WORD wDelayTime; 
BYTE byTransparencyIndex; 
BYTE byTerminator; 
} GIFCONTROL; 
(4) 处 理 方法 (disposal method) 规 定 图 形 显示 之 后 译 码 器 要 用 规定 的 方法 进行 处 理 。 
用 户 输入 标志 (user input flag) 域 表示 在 继续 处 理 之 前 是 否 需 要 用 户 输入 响应 。 在 延 时 时 
间 和 用 户 输入 标志 都 设置 为 1 的 情况 下 ,继续 处 理 的 开始 时 间 取 决 于 用 户 响 应 输入 在 前 还 
是 延 时 时 间 结 束 在 前 。 
(5) 透明 (transparency flag) 表 示 是 否 给 出 透明 索引 。 
(6) 延 时 时 间 (delay time) 用 于 指定 在 图 形 显示 之 后 继续 处 理 数据 流 之 前 的 等 待 时 间 ， 
一 百 分 之 一 秒 为 单位 。 
(7) 当 且 仅 当 透明 标志 位 设置 为 1 时 ,透明 索引 用 于 指示 处 理 程序 是 否 要 修改 显示 设 
备 上 的 相应 像 点 。 当 且 仅 当 透 明 标 志 位 设置 为 1 时 ,就 要 修改 。 
(8) 块 结束 符 (block terminator) 表 示 该 图 形 控制 扩展 块 结束 , 它 是 由 一 个 字 节 组 成 的 
数据 块 ,该 域 的 值 是 一 个 固定 的 值 0x00。 
8. 无 格式 文本 扩展 块 
无 格式 文本 扩展 块 即 图 像 说 明 扩 充 块 ,无 格式 文本 扩展 块 包含 文本 数据 和 描绘 文本 所 
需 的 参数 。 文 本 数据 用 7 位 的 ASCII 字 符 编码 并 以 图 形 形 式 显示 。 扩 展 块 的 结构 如 下 。 


typedef struct gifplaintext 
{ 
BYTE byBlockSize; 
WORD wTextGridLeft; 
WORD wTextGridTop; 
WORD wTextGridWidth; 
WORD wTextGridDepth; 
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BYTE byCharCellWidth; 
BYTE byCharCellDepth; 
BYTE byForeColorIndex; 
BYTE byBackColorIndex; 
} GIFPLAINTEXT; 
其 中 ,byBlockSize 用 于 指定 该 图 像 扩 充 块 的 长 度 , 取 值 为 13; wTextGridLeft 用 于 指 
定 文字 显示 方 格 相对 于 逻辑 屏幕 左上 角 的 X 坐标 (像素 ); wTextGridTop 用 于 指定 文字 显 
示 方 格 相对 于 逻辑 屏幕 左上 角 的 Y 坐标 ; wTextGridWidth 用 于 指定 文字 显示 方 格 的 宽 
度 ; wTextGridDepth 用 于 指定 文字 显示 方 格 的 高 度 ; byCharCellWidth 用 于 指定 字符 的 宽 
度 ; byCharCellDepth 用 于 指定 字符 的 高 度 ; byForeColorIndex 用 于 指定 字符 的 前 景色 ; 
byBackColorIndex 用 于 指定 字符 的 背景 色 。 
9. 注释 扩展 块 
注释 扩展 块 (comment extension) 域 的 内 容 用 于 说 明 图 形 、 作 者 或 者 其 他 任何 非 图 形 数 
据 和 控制 信息 的 文本 信息 。 其 中 的 注释 数据 是 序列 数据 子 块 ,每 块 字 节 数 为 1 一 255。 
10. 应 用 程序 扩展 块 
应 用 程序 扩展 块 (application extension) 包 含 制作 该 图 像 文件 的 应 用 程序 的 相关 信息 ， 
GIF 中 用 识别 码 0xFF 来 判断 一 个 扩充 块 是 否 为 应 用 程序 扩充 块 。 它 的 结构 定义 如 下 : 


typedef struct gifapplication 
{ 
BYTE byBlockSize; 
BYTE byIdentifier[8]; 
BYTE byAuthentication[3]; 
} GIFAPPLICATION; 


其 中 ,byBlockSize 用 于 指定 该 应 用 程序 扩充 块 的 长 度 ,其 值 为 12; byIdentifier 用 于 指 
定 应 用 程序 名 称 ; byAuthentication 用 于 指定 应 用 程序 的 识别 码 。 

11. GIF 文件 结束 块 

结束 块 (GIF trailer) 表 示 GIF 文件 的 结尾 , 它 包含 一 个 固定 的 数值 0x3B。 


2.6 数字 图 像 的 显示 特性 


一 般 而 言 ,数字 图 像 处 理 的 结果 依然 是 图 像 ,还 需要 将 图 像 显 示 或 打印 以 给 人 们 观看 或 
保存 。 因 此 可 以 说 ,图 像 的 显示 是 数字 图 像 处 理 的 一 个 重要 步骤 。 


2.6.1 图 像 的 显示 


图 像 需 通过 屏幕 显示 或 打印 输出 才 可 以 观察 到 ,图 像 屏 幕 显示 的 效果 由 图 像 的 大 小 、 光 
度 分 辩 率 、 低 频 响应 、 高 频 响应 、 点 间距 和 噪声 特性 等 因素 决定 。 

图 像 显示 系统 用 于 显示 显示 器 的 物理 尺寸 和 系统 可 处 理 的 数字 图 像 大 小 。 显 示 器 自身 
的 物理 尺寸 显然 决定 了 可 显示 图 像 的 大 小 ,因此 它 应 该 尽 可 能 大 ,以 便于 观察 和 理解 所 显示 
的 图 像 。 显 示 系 统 能 处 理 的 最 大 数字 图 像 尺寸 是 图 像 处 理 系统 的 主要 指标 之 一 ,显示 器 尺 
十 不足 会 降低 整个 图 像 处 理 设备 的 效果 ,显示 器 必须 与 待 处 理 和 显示 的 最 大 图 像 的 行 数 和 
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每 行 像素 数 相 适应 。 数 字 图 像 处 理 系统 的 常见 显示 设备 主要 包括 可 随机 存 取 的 CRT( 阴 极 
射线 管 )、 电 视 显示 器 和 LCD( 液 晶 显 示 器 ) 。 

对 于 CRT, 电 子 枪 束 的 水 平 位 置 是 计算 机 可 以 控制 的 ,在 每 个 偏转 位 置 ,电子 枪 束 的 强 
度 是 通过 电压 进行 调制 的 ,而 这 一 电压 值 与 该 点 对 应 的 灰 度 值 成 正比 。 这 样 灰 度 值 的 变化 
反映 在 CRT 上 就 是 亮度 的 变化 。 对 于 普通 的 电视 监视 器 若 能 提供 合适 的 视频 信号 ,也 可 
用 作 数 字 图 像 显示 器 。 

LCD 是 另 一 种 常用 的 显示 设备 , 它 是 一 种 低 电 压 、 低 功 耗 器 件 , 可 直接 由 MOS-IC 驱 
动 , 因 此 器 件 和 驱动 系统 之 间 的 配合 较 好 。LCD 的 优点 是 结构 简单 .平面 型 ,显示 面 可 任意 
加 工 ,而 且 LCD 是 反射 型 的 ,在 室内 条 件 也 容易 看 到 数字 图 像 。 目 前 ,台式 计算 机 、 笔 记 本 
电脑 手表、 玩具 、 计 算 器 、 民 航 候 机 牌 、 火 车 候车 室 、 户 外 广告 ,以 及 测量 仪器 和 航天 测控 显 
示 等 都 广泛 使 用 LCD 液晶 显示 设备 。 

计算 机 系统 中 ,数字 图 像 是 通过 光栅 扫描 方式 和 计算 机 内 的 帧 缓冲 存储 器 进行 屏幕 显 
示 的 。 

首先 介绍 什么 是 帧 缓冲 存储 器 。 任 何 一 台 具 有 显示 功能 的 计算 机 内 都 设 有 专门 用 于 存 
储 图 像 信息 的 帧 缓冲 存储 器 ,计算 机 时 刻 自 动 监测 该 存储 器 ,如 果 帧 缓冲 存储 器 内 被 写 人 图 
像 数 据 , 则 这 些 数 据 会 自动 经 光栅 扫描 方式 映射 到 计算 机 显示 屏幕 上 ,从 而 形成 数字 图 像 。 
帧 缓冲 存储 器 中 的 每 一 位 对 应 于 屏幕 上 的 一 个 点 , 当 某 一 位 上 的 数据 被 置 为 1 时 ,与 该 数据 
位 对 应 的 计算 机 屏幕 上 的 相应 坐标 位 置 上 就 出 现 一 个 亮点 ,而 数据 位 为 0 时 ,屏幕 上 的 相应 
坐标 位 置 则 产生 一 个 暗 点 。 计 算 机 开始 启动 时 , 帧 缓冲 存储 器 上 所 有 的 位 被 自动 置 为 0, 当 
读 和 人 图像 数据 后 , 帧 缓冲 存储 器 才 会 根据 图 像 数 据 的 每 一 位 分 别 置 0 或 置 1 。 

例如 , 若 一 台 计 算 机 的 显示 器 分 辩 率 设 定 为 640X480 ,为 显示 一 幅 二 值 图 像 需 640 xX 
480 位 的 帧 缓存 容量 ,这 个 容量 称 为 一 个 位 平面 。 因 此 , 若 显示 一 幅 256 灰 度 级 的 单 色 图 像 
则 需要 配置 8 个 位 平面 , 即 需要 640X480 字 节 的 帧 缓存 容量 。 若 显示 器 设置 为 800X600、 
1024X768 或 1280X1024 等 高 分 辩 率 时 , 则 所 需 的 帧 缓存 容量 要 求 相应 增 大 。 若 需要 显示 
R、G、B 均 为 256 级 的 真 彩色 图 像 , 则 需要 进行 R.G、B 三 色 合成 ,因此 帧 缓存 的 容量 是 单 色 
256 灰 度 级 显示 容量 的 3 倍 。 

若 操作 系统 允许 用 户 对 显示 器 的 分 辩 率 进行 设置 , 则 应 充分 考虑 计算 机 现 有 的 帧 缓存 
容量 的 容许 范围 。 例 如 , 当 现 有 的 帧 缓存 为 512KB 时 ,为 显示 256 灰 度 的 单 色 数字 图 像 ,最 
多 只 能 选用 800X 600 的 分 辨 率 。 如 果 选 用 1024X768 的 分 辩 率 , 则 图 像 的 灰 度 将 降 至 16 个 
等 级 , 即 4bit 图 像 。 可 以 通过 增设 帧 缓存 的 容量 来 获取 较 大 的 分 辩 率 ,需要 注意 的 是 , 若 显示 
器 不 具备 显示 较 高 分 辨 率 的 能 力 ,即使 配置 了 足够 的 帧 缓存 ,也 仍然 不 能 得 到 高 的 分 辩 率 。 

熟悉 帧 缓冲 存储 器 的 原理 和 作用 之 后 . 则 可 以 通过 直接 向 帧 缓存 填写 图 像 数据 来 显示 
图 像 。 需 指出 的 是 ,每 一 个 像素 上 的 数据 在 帧 缓存 上 是 以 位 为 单位 描述 的 ,而 计算 机 的 数据 
输入 /输出 一 般 以 字 节 为 单位 ,因此 图 像 数据 中 的 每 一 个 字 节 对 应 显示 画面 上 横向 排列 的 8 
个 像素 。 


2.6.2 图 像 的 打印 


数字 图 像 除 可 进行 显示 外 ,还 可 以 通过 各 种 打印 设备 将 图 像 打 印 出 来 。 在 有 些 图 像 处 
理 著 作 中 ,将 图 像 打 印 输出 又 称 为 图 像 的 永久 显示 ,将 图 像 永 久 记录 在 纸 或 胶片 等 介质 上 都 
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称 为 图 像 的 永久 显示 。 图 像 的 打印 设备 包括 图 像 记录 器 、 打 印 机 和 其 他 图 像 硬 拷贝 设备 等 。 

1. 半 调 输出 技术 

一 般 情况 下 ,打印 设备 只 能 输出 二 值 图 像 ,以 激光 打印 机 为 例 ,其 输出 的 灰 度 只 有 两 极 ， 
或 者 输出 为 黑色 的 打印 点 ,或 者 输出 为 白色 点 (无 黑 )。 为 了 在 现行 的 打印 设备 上 输出 灰 度 
图 像 , 常 采用 半 调 输出 技术 。 半 调 输出 技术 是 一 种 利用 人 类 的 视觉 原理 ,将 灰 度 图 像 转换 为 
二 值 图 像 的 技术 。 半 调 输 出 的 基本 原理 是 将 输出 图 像 中 的 灰 度 转换 为 二 值 点 的 模式 ,从 而 
使 现 有 的 仅 能 输出 二 值 图 像 的 打印 设备 输出 灰 度 图 像 。 

半 调 输出 本 质 上 是 一 种 利用 人 类 视觉 原理 的 特定 输出 方法 , 即 通过 控制 二 值 点 输出 模 
式 的 形式 (包括 数量 .尺寸 和 形状 等 ) 使 人 类 视觉 系统 获得 灰 度 级 别 上 的 视觉 效果 。 也 就 是 
说 , 半 调 输出 利用 了 视觉 系统 在 微观 上 的 视觉 平均 特性 ,以 单位 面积 上 二 值 黑 点 的 多 少 、 黑 
点 的 大 小 来 体现 不 同 的 灰 度 等 级 ,如 果 对 半 调 输出 的 图 像 进行 足够 的 放大 ,呈现 出 来 的 依然 
是 二 值 图 像 。 

2. 半 调 输出 模板 

半 调 输出 模板 是 半 调 输出 的 一 种 具体 实现 方法 ,是 指 将 图 像 输 出 的 单元 进行 细 分 ,通过 
邻近 的 二 值 点 结合 起 来 组 成 图 像 输出 单元 。 这 样 细 分 之 后 ,图 像 输 出 的 基本 单元 包含 若干 
二 值 点 ,这 些 二 值 点 组 成 一 个 模板 ,使 模板 中 的 一 些 二 值 点 输出 墨 点 ,而 其 他 二 值 点 的 输出 
为 没有 墨色 的 空白 点 ,从 而 达到 显示 不 同 灰 度 等 级 的 效果 。 

例如 ,图 2-14(a) 所 示 为 2X2 模板 , 即 一 个 输出 单元 分 为 2X2 网 格 ,这样 就 可 以 实现 5 
个 灰 度 等 级 的 打印 输出 效果 ; 图 2-14(b) 所 示 为 3X3 模板 ,可 实现 10 个 灰 度 等 级 效果 。 需 
要 说 明 的 是 ,这 里 将 输出 的 二 值 点 进行 了 放大 ,实际 打印 机 的 二 值 点 比 图 2-14 所 示 的 二 值 
点 小 很 多 ,放大 的 目的 是 更 形象 地 说 明 半 调 输出 技术 的 效果 。 
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(a) 2X2 模 板 
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(b) 3x3 模 板 
图 2-14 半 调 输出 技术 模板 


3. 半 调 输出 的 种 类 

半 调 输出 技术 主要 包括 幅度 调制 技术 和 频率 调制 技术 两 种 方法 。 

1) 幅度 调制 

半 调 输出 技术 的 早期 主要 通过 控制 输出 墨 点 的 尺寸 来 形成 灰 度 图 像 的 显示 效果 ,这 就 
是 半 调 输出 技术 中 的 幅度 调制 (AM) 技 术 。 在 幅度 调制 技术 中 ,二 值 墨 点 是 按 规则 进行 排 
列 的 ,二 值 墨 点 的 大 小 需 根据 所 表示 的 灰 度 值 而 变化 ,但 对 二 值 墨 点 的 形状 没有 具体 要 求 。 
以 激光 打印 机 为 例 , 其 不 同 的 灰 度 显示 效果 是 通过 控制 墨水 墨 点 的 比例 而 达到 的 。 实 际 上 ， 
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二 值 墨 点 的 输出 模式 不 仅 取决 于 每 个 点 的 尺寸 ,也 取决 于 网 格 的 间隔 距离 大 小 ,间隔 越 大 ， 
分 辩 率 越 低 ,间隔 越 小 ,输出 的 分 辩 率 越 高 。 网 格 的 间隔 大 小 与 打印 机 分 辩 率 (每 英寸 的 打 
印 点 数 ) 有 关 。 

2) 频率 调制 

频率 调制 技术 (FM) 是 相对 于 幅度 调制 而 言 的 ,所 谓 频 率 调制 的 半 调 输出 是 指 输出 二 
值 点 的 尺寸 是 不 变 的 ,二 值 点 在 空间 的 分 布 与 灰 度 有 关 。 二 值 点 的 空间 分 布 是 指 墨 点 的 间 
隔 或 者 一 定 区 域内 墨 点 出 现 的 频率 。 显 然 , 当 二 值 点 分 布 比较 密集 时 ,将 实现 较 暗 的 灰 度 
级 ,二 值 点 分 布 比 较 稀 朴 时 ,就 可 以 实现 较 亮 的 灰 度 等 级 。 

随 着 对 打印 质量 要 求 的 不 断 提高 ,单一 的 幅度 调制 技术 和 频率 调制 技术 都 达到 了 自身 
的 极限 ,目前 ,业界 开始 采用 将 幅度 调制 和 频率 调制 技术 相 结合 的 图 像 输 出 方法 。 需 要 指出 
的 是 ,对 于 半 调 输出 技术 而 言 ,车 需要 输出 256 灰 度 级 效果 , 需 采 用 16X16 的 模板 ,这 样 输 
出 图 像 的 空间 分 辨 率 将 受到 较 大 的 影响 。 因 此 , 半 调 输出 技术 仅 在 输出 设备 自身 的 灰 度 值 
有 限 的 情况 下 才 可 以 考虑 使 用 。 


2.7 ”图像 质量 评价 


图 像 是 人 们 获取 信息 的 重要 途径 ,其 所 承载 的 信息 非常 丰富 。 图 像 在 获取 、 处 理 、 传 输 
和 存储 的 过 程 中 ,由 于 各 种 因素 的 影响 ,将 可 能 影响 到 图 像 质量 ,这 给 图 像 的 后 期 处 理 带 来 
了 一 定 的 困难 。 因 此 ,建立 图 像 质 量 评价 机 制 具有 重要 的 意义 ,是 图 像 处 理工 程 的 基础 技术 
Rp 


2.7.1 图 像 质量 评价 方法 


图 像 质 量 评价 涉及 图 像 处 理 的 许多 方面 ,如 压缩 传输 、 存 储 、 增 强 、 水 印 等 。 一 个 有 效 
的 评价 标准 至 少 具有 三 种 应 用 : 第 一 ,可 以 在 质量 控制 系统 中 检测 图 像 质量 ,例如 图 像 采 集 
系统 利用 其 来 自动 调整 系统 参数 ,从 而 获得 更 高 质量 的 图 像 ; 第 二 ,用 于 衡量 图 像 处 理 系 统 
和 算法 的 有 效 性 ; 第 三 ,可 以 嵌入 到 图 像 处 理 系 统 中 用 于 优化 系统 和 参数 设置 ,在 视频 通信 
系统 中 ,质量 标准 既 能 辅助 编码 端的 预 滤 波 和 比特 分 配 算法 的 设计 ,又 能 辅助 解码 端的 最 优 
重 构 .误差 消除 和 后 滤波 算法 的 设计 。 

图 像 质量 评价 可 分 为 主观 评价 和 客观 评价 两 大 类 方法 。 主 观 评价 法 主要 凭借 评价 人 员 
的 主观 感知 来 评价 图 像 质量 ; 客观 评价 法 依据 评价 的 数学 模型 给 出 量化 指标 ,模拟 人 类 视 
觉 系统 感知 机 制衡 量 图 像 质 量 。 图 像 质量 评价 还 有 一 些 其 他 评价 方法 ,如 根据 有 无 参考 图 
像 又 可 以 将 图 像 质量 评价 方法 分 为 有 参考 评价 模型 和 无 参考 评价 模型 。 有 参考 评价 模型 是 
指 根据 一 幅 参 考 图 像 ,对 经 过 处 理 的 图 像 进行 评价 。 在 图 像 复原 .图 像 去 模糊 化 等 处 理 时 常 
采用 这 种 评价 方法 。 无 参考 评价 模型 是 指 没有 参考 图 像 , 直 接 根据 图 像 的 统计 特性 或 观察 
者 对 图 像 的 主观 打分 进行 质量 评价 。 

图 像 质量 的 主观 评价 方法 (mean opinion score.MOS) 考 虑 了 观察 者 对 图 像 的 理解 效 
果 , 常 用 方法 包括 平均 主观 分 值 法 (MOS) 和 差分 主观 分 值 法 (DMOS)。 平 均 主 观 分 值 法 是 
通过 不 同 观测 者 对 于 图 像 质量 评价 得 出 的 主观 分 值 进行 平均 来 得 到 归 一 化 的 分 值 ,以 该 分 
值 表示 该 图 像 质量 。 评 价 标准 分 为 优良 .中 、 差 、 劣 五 等 。 对 应 这 五 个 标准 有 两 种 类 型 的 分 
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值 , 即 图 像 主观 绝对 分 值 和 图 像 主观 相对 分 值 。 主 观 绝对 分 值 是 观测 者 对 于 图 像 本 身 的 主 
观 分 值 ,主观 相对 分 值 是 观测 者 对 于 图 像 在 一 组 图 像 中 的 相对 其 他 图 像 的 分 值 。 由 于 主观 
评价 方法 受到 观察 者 知识 背景 观测 目的 和 环境 等 影响 ,稳定 性 和 可 移植 性 差 , 且 难 以 用 数 
学 模型 进行 表达 。 

客观 质量 评价 是 指使 用 一 个 或 多 个 图 像 质量 的 度量 指标 ,建立 与 图 像 质量 相关 的 数学 
模型 ,采用 计算 机 自动 计算 出 图 像 质量 ,其 目标 是 客观 评价 结果 与 人 的 主观 感受 相 一 致 。 


2.7.2 均 方 误差 
图 像 质量 的 均 方 误差 评价 (mean square error, MSE) 方 法 是 一 种 常用 的 图 像 质 量 评价 
方法 , 它 是 指 被 评价 图 像 与 参考 图 像 对 应 位 置 像 素 值 误差 的 平方 均值 误差 。 假 设 有 一 幅 参 


考 图 像 /(x,y), 男 有 一 个 受到 污染 的 图 像 g(x,y) ,如 欲 对 图 像 g(x,y) 进 行 质量 评价 ,其 均 
方 误差 计算 公式 为 


M N 
MSE = Hy 2 PDL/ C3) — gr,y)] (2-6) 


z=1 y=1 


根据 均 方 误差 的 定义 ,误差 值 越 大 ,说 明 图 像 像素 值 整体 差异 大 ,图 像 质量 越 差 ; 反之 ， 
均 方 误差 越 小 ,说 明 图 像 质量 越 好 。 均 方 误差 为 0, 则 被 评价 图 像 与 参考 图 像 完 全 一 致 。 


2.7.3 信 噪 比 与 峰值 信 噪 比 

图 像 的 信 噪 比 也 是 常用 的 图 像 质量 评价 指标 之 一 ,是 参考 图 像 像素 值 的 平方 均值 与 均 
方 误差 比值 的 对 数 的 10 倍 。 若 一 幅 参 考 图 像 用 f(x,y) 表 示 , 而 受到 污染 的 图 像 用 g(x,y) 
表示 ,如 欲 对 图 像 g(z,y) 进 行 质量 评价 ,其 信 噪 比 (signal noise ration, SNR) 误 差 计 算 公 
式 为 


去 > f(z) > f°(r,y) 
SNR = 1l0lg pa 101g < ———> (2-7) 
> 7 党 jz5 坟 二 本 (zs 由 下 
es 二 


由 式 (2-7) 可 以 看 出 ,在 均 方 误差 相同 的 情况 下 ,对 于 不 同 的 图 像 , 由 于 像素 值 不 同 ,其 
信 噪 比 很 可 能 不 一 样 。 

为 了 消除 图 像 自 身 像 素 值 大 小 对 评价 指标 产生 的 影响 ,通常 采用 峰值 信 噪 比 (peak 
signal noise ration,PSNR) ,这 是 一 种 与 信 噪 比 相似 的 质量 度量 准则 。PSNR 定义 为 图 像 所 
容许 的 最 大 像素 值 平 方 与 均 方 误差 比值 的 对 数 的 10 倍 。 如 以 8 位 灰 度 图 像 为 例 , 由 于 最 大 
像素 值 为 255 ,因此 峰值 信 噪 比 公 式 为 


PSNR = 10lg 一 


(2-8) 


2.7.4 结构 相似 度 

在 图 像 质量 评价 机 制 中 ,研究 人 员 发 现 MSE、SNR、PSNR 等 评价 方法 有 时 可 能 与 人 
的 视觉 感受 出 现 较 大 的 差异 。 为 此 ,近年 来 研究 了 很 多 更 接近 人 类 视觉 特性 的 客观 评价 
方法 。 其 中 得 到 广泛 应 用 和 认可 的 是 Wang 等 研究 人 员 提 出 的 结构 相似 度 (structral 
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similarity, SSIM) 评 价 法 。 
结构 相似 度 评价 方法 考虑 了 两 幅 图 像 的 亮度 、 对 比 度 和 结构 等 因素 对 相似 性 的 影响 。 
图 2-15 所 示 是 结构 相似 度 算法 流程 。 


ae 


亮度 测量 亮度 比较 
由 -| 对 比 度 测量 | 一 | 
评价 
对 比 度 比较 "| 综合 
日 你 
失真 中 像 | 充 度 测量 T 
1 
(DT 对 比 度 测量 1 结构 比较 


图 2-15 ”结构 相似 度 算法 流程 


Wang 提出 的 结构 相似 度 的 计算 模型 为 
SSIM(z,y) = [zw [cecCzyy)]?[LsCzy) 了 了 (2-9) 
一 般 取 a==B 二 7 二 1,LCz,y) vc(z,y)、s(z,y) 分 别 为 亮度 相似 度 、 对 比 度 相似 度 和 结构 
相似 度 的 度量 值 ,为 三 个 正 数 , 用 于 调节 不 同 因素 的 影响 权重 。 亮度、 对 比 度 和 结构 相似 度 
分 别 定 义 如 下 : 


2prpy 十 ci 
WO = 
a 站 十 岂 寺 而 


20rpy 十 cz 

zy) = FS 

IY TR+o+e 
ay 十 cs 

5s(zyy) = 

S04 Oz0y 十 cs 


其 中 ,yoryovyow 分 别 为 两 幅 图 像 的 均值 .标准 差 和 协 方差 ; cl 、c 和 cs 为 三 个 远 小 于 
最 大 灰 度 值 平方 的 常数 ,通常 取 值 为 二 (hL)? ,cs 二 (ksL)? cs 一 cz/2A As 取 远 小 于 1 的 
数 ,L 是 指 像素 的 最 大 值 ,通常 取 k 二 0. 01,k, 二 0.03,LL 二 255 ,计算 方法 如 下 : 


Dz, 坟 二 Na ps (2-10) 
i=1 i=1 
I Ll 
m= NZ “= /ni ( 关 一 多 (2-11) 
a i 
1 N 
By N12 pi) Cy — py) (2-12) 
i=1 


该 方法 基于 光照 对 于 物体 结构 是 独立 的 ,而 光照 改变 主要 来 源 于 亮度 和 对 比 度 ,所 
以 它 将 亮度 和 对 比 度 从 图 像 的 结构 信息 中 分 离 出 来 ,并 结合 结构 信息 对 图 像 质量 进行 评 
价 。 基 于 这 一 类 原理 的 方法 在 一 定 程度 上 避 开 了 自然 图 像 内 容 的 复杂 性 及 多 通道 的 去 
相关 问题 ,直接 评价 图 像 的 结构 相似 性 。SSIM 的 值 域 范 围 为 [0,1], 并 且 满 足 距离 度量 
的 至 个 性 质 。 

SSIM 的 值 域 范围 为 [0,1] ,并且 满足 距离 度量 的 三 个 性 质 。 
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(1) 对 称 性 : SSIM(z,y) 二 SSIM(y,z)。 

(2) 有 界 性 : 0 过 SSIM(Cz,y) 和 1。 

(3) 最 大 值 唯 一 性 : SSIMCz,y) 王 1 人 xz 一 y。 

考虑 到 图 像 的 亮度 和 对 比 度 与 图 像 内 容 具 有 密 不 可 分 的 关系 ,无 论 是 亮度 还 是 对 比 度 ， 
在 图 像 的 不 同位 置 可 能 有 不 同 的 值 , 因 此 ,实际 应 用 中 通常 可 将 图 像 分 为 多 个 子 块 ,分 别 计 
算 各 个 子 块 的 结构 相似 度 ,然后 由 各 个 子 块 的 相似 度 计算 出 平均 相似 度 (mean structure 
similarity) ,以 该 平均 值 作为 两 幅 图 像 的 结构 相似 度 。 


2.8 灰 度 直 方 图 


直方 图 是 进行 数据 统计 的 一 个 简单 .高效 和 常用 的 工具 , 灰 度 直方 图 也 是 数字 图 像 处 理 
中 一 个 方便 有 效 的 常用 工具 。 灰 度 直方 图 是 基于 图 像 灰 度 值 和 像素 统计 分 布 的 形象 表示 ， 
它 概括 地 表示 了 一 幅 图 像 的 灰 度 级 信息 。 任 何 一 幅 图 像 的 直方 图 都 包括 了 该 图 像 的 许多 特 
征 信息 , 某 些 特定 类 型 的 图 像 甚至 可 由 直方 图 来 完全 描述 。 


2.8.1 直方 图 的 定义 与 性 质 


1. 直方 图 的 定义 

直方 图 是 统计 学 中 的 常用 工具 之 一 ,在 数字 图 像 处 理 中 灰 度 直方 图 是 灰 度 级 的 函数 , 它 
描述 了 图 像 中 具有 该 灰 度 级 的 像素 的 个 数 , 其 横 坐 标 是 灰 度 级 , 纵 坐标 是 该 灰 度 出 现 的 频率 
(像素 的 个 数 ) 。 

对 于 连续 函数 表示 的 图 像 , 其 灰 度 直方 图 也 有 另 一 种 定义 方式 。 在 图 2-16 所 示 的 图 像 
中 ,有 一 条 灰 度 级 为 Di 的 轮廓 线 ,在 更 高 的 灰 度 级 D; 处 有 第 二 条 轮廓 线 。A' 表示 第 一 条 
轮廓 线 所 包围 区 域 的 面积 ,同样 ,以 A* 表示 第 二 条 轮廓 线 所 包围 的 区 域 的 面积 。 


D,=DI+AD 


D 


图 2-16 一 幅 图 像 的 轮廓 线 


在 一 幅 连 续 图 像 中 ,将 灰 度 级 为 D 的 轮廓 线 所 包围 的 面积 称 为 灰 度 级 D 的 立 值 面积 函 
数 , 用 A(D) 表 示 , 则 直方 图 可 定义 为 
.~ A(D)— A(D+ AD) 
HD = 如- 人 
因此 ,一 幅 连 续 图 像 的 直方 图 是 其 面积 函数 的 导数 的 负 值 。 负 号 的 产生 是 因为 随 着 D 
的 增加 面积 函数 A(CD) 的 值 在 减少 。 若 将 图 像 看 成 是 一 个 二 维 的 随机 变量 , 则 面积 函数 相 


d 
ad4(CD) (2-13) 
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当 于 其 累积 分 布 函数 ,而 灰 度 直方 图 则 相当 于 其 概率 密度 函数 。 
对 于 离散 函数 ,固定 AD 为 1, 则 上 述 定 义 为 


HD) = A(D) —A(D+1) (2-14) 
对 于 数字 图 像 , 任 一 灰 度 级 D 的 面积 函数 就 是 大 于 或 等 于 该 灰 度 值 的 像素 个 数 。 
2. 直方 图 的 性 质 
直方 图 具有 以 下 性 质 : 


(1) 直方 图 是 一 幅 图 像 中 各 像素 灰 度 值 出 现 次 数 或 频数 的 统计 结果 , 它 只 反映 该 图 像 
中 不 同 灰 度 值 出 现 的 频率 ,而 不 能 反映 某 一 灰 度 值 像素 所 在 的 位 置信 息 。 即 直方 图 仅 包含 
了 该 图 像 中 某 一 灰 度 值 的 像素 出 现 的 概率 ,而 丢失 了 其 所 在 位 置 的 信息 。 

(2) 任 一 幅 图 像 ,都 能 唯一 地 确定 一 个 与 之 对 应 的 直方 图 。 但 不 同 的 图 像 ,可 能 有 相同 
的 直方 图 。 也 就 是 说 ,图 像 与 直方 图 之 间 是 一 种 多 对 一 的 映射 关系 。 

(3) 由 于 直方 图 是 对 具有 相同 灰 度 值 的 像素 统计 计数 得 到 的 , 若 某 一 幅 图 像 由 若干 子 
图 像 区 域 构成 ,那么 各 子 区域 直 方 图 之 和 就 等 于 原 图 像 的 直方 图 。 


2.8.2 直方 图 的 作用 


1. 数字 化 参数 

直方 图 给 出 了 一 个 简单 直观 的 可 视 化 指标 ,可 用 于 判断 一 幅 图 像 是 否 合理 地 利用 了 全 
部 被 允许 的 灰 度 级 范围 。 若 图 像 亮 度 具 有 超出 数字 化 器 所 能 量化 的 范围 , 则 这 些 灰 度 级 将 
被 简单 地 置 为 0 或 255, 这 时 ,根据 直方 图 的 定义 和 意义 ,在 其 一 端 或 两 端 将 产生 尖峰 。 对 
直方 图 的 快速 检查 可 以 使 数字 化 中 产生 的 问题 及 早 暴露 出 来 ,以 便 及 时 纠正 。 

2. 选择 边界 阅 值 

假定 一 幅 图 像 背景 是 浅 色 的 ,其 中 有 一 个 深 色 的 物体 ,图 2-17 所 示 为 这 类 图 像 的 直方 
图 。 物 体 中 的 深 色 像素 产生 了 直方 图 上 的 左 峰 , 而 背景 中 大 量 的 灰 度 级 产生 了 直方 图 上 的 
右 峰 。 物 体 边界 处 处 于 两 个 峰值 之 间 灰 度 级 的 像素 数目 相对 较 少 ,从 而 产生 了 两 峰之 间 的 
谷 。 选 择 谷 作为 灰 度 阅 值 将 得 到 合理 的 物体 的 边界 。 


| 1 1 | 
100 了 200 225  ” 灰 度 


图 2-17 双 峰 直方 图 


在 某 种 意义 上 来 说 ,选择 对 应 于 两 峰之 间 的 最 低 点 的 灰 度 值 作为 阔 值 来 确定 边界 是 较 
合适 的 。 由 式 (2-13) 可 知 ,直方 图 是 面积 函数 导数 的 负 值 。 在 谷底 的 附近 ,直方 图 的 值 相对 
较 小 ,意味 着 面积 函数 随 阔 值 灰 度 级 的 变化 很 缓慢 。 如 果 选 择 谷底 处 的 灰 度 作为 冰 值 ,将 可 
以 使 其 对 图 像 内 物体 的 边界 的 影响 达到 最 小 。 如 果 和 欲 测 量 原 图 像 的 面积 ,选择 谷底 处 作为 
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阔 值 可 使 测量 对 于 阔 值 灰 度 变化 的 敏感 庶 降 至 最 小 。 

3. 计算 综合 光 密 度 

某 些 情况 下 ,综合 光 密度 是 图 像 质量 一 个 很 有 用 的 度量 ,利用 直方 图 可 直接 计算 出 综合 
光 密 度 值 。 综 合 光 密度 用 IOD 来 表示 ,以 二 维 图 像 为 例 , 设 D(x,y) 表 示 二 维 图 像 的 灰 度 分 
布 , 则 综合 光 密 度 为 


IOD = [fpe, wardy (2-15) 
其 中 ,a 和 2 是 图 像 区 域 的 边界 。 对 于 数字 图 像 ,. 则 有 
10D = 3 Dpi,)) (2-16) 


其 中 ,D(i,j) 是 像素 点 (i, 站 处 的 灰 度 值 。 Ni 和 NN, 分 别 是 图 像 行 和 列 的 数目 。 令 N, 代 表 灰 
度 级 为 & 时 所 对 应 的 像素 的 个 数 , 则 式 (2-16) 可 以 化 为 


255 
IOD = >) XN 


t= 
由 于 Ni 二 HH(k), 因 此 有 


255 


IOD = >)AH(A) (2-17) 


k=0 


即 综合 光 密 度 是 用 灰 度 级 加 权 的 直方 图 之 和 。 
令 式 (2-16) 等 于 式 (2-17), 同 时 使 灰 度 级 的 增 量 趋 于 0, 则 可 以 得 到 适用 于 连续 图 像 的 
综合 光 密度 公式 为 


IOD = | pH pyap (2-18) 
5 
以 及 
afb co 
| | D(zx,y)drdy = | DH (D)dD (2-19) 


若 图 像 中 的 物体 被 阔 值 灰 度 级 为 工 的 边界 描绘 出 来 , 则 物体 边界 内 的 IOD 值 可 以 采用 
如 下 公式 计算 , 即 


IOD(T) = | -pH pap (2-20) 
内 部 灰 度 级 的 平均 值 MGL 等 于 IOD 与 面积 之 比值 , 即 
Mt — OD JipH pap op 
MD = 
| HD dD 
ri 


2.8.3 直方 图 与 图 像 的 关系 


对 于 任 一 幅 图 像 ,直方 图 是 唯一 的 , 若 已 知 一 幅 图 像 的 函数 形式 , 则 可 计算 其 直方 图 。 
由 于 直方 图 是 面积 函数 关于 灰 度 级 的 导数 的 负 值 。 因 此 ,如 果 能 从 图 像 本 身 的 表达 式 得 出 
面积 函数 , 则 有 可 能 获得 直方 图 。 如 图 2-18 所 示 , 设 图 像 是 中 心 在 原点 的 圆 对 称 高 斯 脉冲 ， 
则 图 像 函 数 的 极 坐标 表示 为 
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1 


图 2-18 圆 形 高 斯 点 


D(r,b) 一 ee 了，0 委 0 过 2r，0 委 到 co (2-22) 
由 于 灰 度 级 为 常数 已 的 轮廓 线 是 半径 为 >(P) 的 圆 ,根据 式 (2-22) 可 得 
ln(P) =—7 
因此 可 得 
r(P) = VM—In(P) 
该 轮廓 线 所 包围 的 面积 为 


A(P) = x [r(P)] =— xln(P) 
对 面积 函数 进行 微分 ,可 得 到 直方 图 函数 , 即 
d 


二 =- 人 = 
H(P)= ape ‘P) P 


曲线 如 图 2-19 所 示 。 


10r 
HP) sx So 
关上 


0 0.5 1.0 
一 一 和 


灰 度 
图 2-19 圆 形 高 斯 点 的 直方 图 


2.9 图 像 的 统计 特征 


图 像 反 映 了 自然 界 中 某 一 物体 或 对 象 的 电磁 波 辆 射 能 量 分 布 情况 ,由 于 成 像 系 统 具 有 
一 定 的 复杂 性 以 及 成 像 过 程 的 随机 性 ,图 像 信 号 /(z,y) 表 现 出 随机 变量 的 特性 。 因 此 ,图 
像 信息 具有 随机 信号 的 性 质 并 且 具 有 统计 性 质 ,因此 统计 分 析 是 数字 图 像 处 理 分 析 的 基本 
方法 之 一 ; 
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2.9.1 图 像 的 基本 统计 分 析 量 


设 /G 7 表示 大 小 为 MX N 的 数字 图 像 , 则 该 图 像 的 基本 统计 量 如 下 。 

1. 图 像 的 信息 量 

一 幅 图 像 如 果 共 有 种 灰 度 值 , 并 且 各 灰 度 值 出 现 的 概率 分 别 为 户 ,p: ,ps，… ,pi, 根 
据 香农 定理 ,图 像 的 信息 量 可 采用 如 下 公式 计算 : 


大 
H =— 2)p' logzp: (2-23) 
= 


式 中 , 砷 称 为 粹 , 当 图 像 中 各 灰 度 值 出 现 的 概率 彼此 相等 时 ,图 像 的 炉 最 大 。 信 息 量 表 示 一 
幅 图 像 所 含 信息 的 多 少 ,常用 于 对 不 同 图 像 处 理 方法 进行 比较 。 例 如 ,对 于 一 幅 采 用 8bit 
表示 的 数字 图 像 ,其 信息 量 为 


255 


H =— 2)p' logsp: (2-24) 


2. 图 像 灰 度 平均 什 
灰 度 均值 是 指 一 幅 图 像 中 所 有 像 元 灰 度 值 的 算术 平均 值 。 根 据 算术 平均 的 意义 ,计算 
公式 为 


一， (2-25) 


图 像 灰 度 平均 值 反映 了 图 像 中 物体 不 同 部 分 的 平均 反射 强度 。 
3. 图 像 灰 度 众 数 
顾名思义 ,图像 灰 度 众 数 是 指 图 像 中 出 现 次 数 最 多 的 灰 度 值 。 其 物理 意义 是 指 一 幅 图 
像 中 面积 占 优 的 物体 的 灰 度 值 信息 。 
4. 图 像 灰 度 中 值 
图 像 灰 度 中 值 是 指数 字 图 像 全 部 灰 度 级 中 处 于 中 间 的 值 , 当 灰 度 级 数 为 偶数 时 , 则 取 中 
间 的 两 个 灰 度 值 的 平均 值 。 例 如 ,车 某 一 图 像 全 部 灰 度 级 为 188、176、171、166、160, 则 灰 度 
中 值 为 171。 
5. 图 像 灰 度 方差 
灰 度 方差 反映 各 像 元 灰 度 值 与 图 像 平 均 灰 度 值 的 离散 程度 ,计算 公式 为 
为 
0 (2-26) 
与 烂 类 似 , 图 像 灰 度 方差 同样 是 衡量 图 像 信息 量 大 小 的 主要 度量 指标 ,是 图 像 统 计 特 性 
中 最 重要 的 统计 量 之 一 ,方差 越 大 ,图 像 的 信息 量 越 大 。 
6. 图 像 灰 度 值 域 
图 像 的 灰 度 值 域 是 指 图 像 最 大 灰 度 值 和 最 小 灰 度 值 之 差 ,计算 公式 为 
Fins FY = fo = aC) (2-27) 


2.9.2 多 维 图 像 的 统计 特性 


数字 图 像 处 理 中 ,一 幅 RGB 彩色 图 像 包含 了 3 个 波段 ,而 一 幅 遥 感 图 像 则 可 包含 多 达 
7 个 波段 的 灰 度 图 像 。 对 于 多 波段 图 像 处 理 , 不 仅 要 考虑 单个 波段 图 像 的 统计 特性 ,还 应 考 
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R23 


岂 


虑 波段 间 存在 的 关联 特征 。 图 像 波段 之 间 的 关联 特性 不 仅 是 图 像 分 析 的 重要 参数 ,而 且 也 
是 图 像 彩 色 合成 方案 的 主要 依据 之 一 。 

1. 协 方差 

设 /(i, 站 和 g(i, 站 表示 大 小 为 MXN 的 两 幅 图 像 , 则 两 者 之 间 的 协 方差 计算 公式 为 


M-1 N-1 


S2 = S$ = 二 2 2G) 一 FILediy) 一 (2-28) 
式 中 ,了 和 分 别 表示 Gi, 站 和 g(i, 站 的 均值 。N 个 波段 相互 间 的 协 方差 矩阵 用 3 表示 ,其 
定义 形式 为 
Si Si Siv 
SH Si Siv 
pe : 《2=29) 
Sh Sa Sky 
2. 相关 系数 


根据 概率 论 与 数理 统计 学 知识 ,数字 图 像 处 理 技 术 中 的 相关 系数 反映 了 两 个 不 同 波段 
图 像 所 含 信息 的 重生 程度 , 它 是 表示 图 像 不 同 波段 间 相 关 程 度 的 统计 量 。 如 果 两 个 波段 间 
的 相关 系数 较 大 , 则 表明 两 个 波段 具有 紧密 的 相关 性 ,一 个 波段 与 其 本 身 的 相关 系数 为 1， 
表明 相关 程度 达到 最 大 值 。 当 相关 系数 非常 大 时 , 仅 选 择 其 中 的 一 个 波段 就 可 以 表示 两 个 
波段 的 信息 。 相 关系 数 的 计算 公式 为 


2 
二 fe -30) 
re SS (2-30 


式 中 ,Sr 、Sw 分 别 表 示 图 像 1(i,j)、g(i,j) 的 标准 差 ; 5 和 为 图 像 /(i,j)、g(i, 站 的 协 方差 。 
六 个 波段 的 相关 系数 矩阵 (简称 为 相关 矩阵)R 定义 为 


1 ns ns rn 
全 oo 
丽人 (2-31) 
rN 7N2 IN3 1 


MU 
赂 


数字 图 像 的 基本 类 型 有 哪 几 种 ? 各 有 何 特点 ? 

什么 是 索引 图 像 和 RGB 彩色 图 像 ? 两 者 有 何 区 别 和 联系 ? 

在 图 像 数 字 化 过 程 中 ,量化 器 起 什么 作用 ? 

图 像 数字 化 器 的 性 能 指标 主要 包括 哪些 ? 

常用 图 像 数字 化 器 有 哪 几 种 ? 

. 试 简 述 什么 是 均匀 采样 和 非 均匀 采样 。 

. 什么 是 线性 量化 和 非 线性 量化 ? 在 图 像 数字 化 过 程 中 , 非 线 性 量化 具有 哪些 主要 


by 
一 


. 简要 分 析 图 像 数 字 化 时 如 何 选择 采样 和 量化 参数 。 
. 什么 是 像素 的 4 邻 域 .8 邻 域 和 对 角 邻 域 ? 
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10. 常用 的 数字 图 像 的 距离 度量 有 几 种 ? 各 有 何 特点 ? 

11. 常见 的 数字 图 像 格式 有 哪些 ? 各 有 何 特点 ? 

12. BMP 图 像 文件 的 特点 有 哪些 ? 它 由 哪 几 部 分 组 成 ? 各 部 分 的 功能 是 什么 ? 

13. BMP 文件 的 文件 头 包 含 哪些 信息 ? FILEHEADER 结构 占 多 少 字 节 ? 这 些 字 节 
长 度 是 如 何 分 配 的 ? 

14. JPEG 图 像 文件 有 何 特点 ? 它 由 哪儿 部 分 组 成 ? 各 部 分 的 功能 是 什么 ? 

15. GIF 和 PNG 各 有 何 特点 ? 简要 描述 其 优 缺点 。 

16. 什么 是 半 调 输出 技术 ? 半 调 输出 技术 有 几 种 实现 类 型 ? 

17. 采用 半 调 输出 技术 时 ,要 实现 16 级 灰 度 效果 , 需 采 用 什么 模板 ? 

18. 试 简 述 半 调 输出 技术 的 特点 ,说 明 采 用 半 调 输出 对 图 像 的 空间 分 辩 率 有 何 影响 。 

19. 图 像 质量 评价 的 方法 是 如 何 分 类 的 ? 

20. 图 像 质量 评价 的 客观 方法 中 常用 的 有 哪些 ? 各 有 何 特点 ? 

21. 什么 是 图 像 的 灰 度 直方 图 ? 灰 度 直方 图 具有 哪些 性 质 和 作用 ? 

22. 什么 是 图 像 的 信息 量 与 灰 度 方差 ? 
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CHAPTER 3 


人 类 视觉 感受 最 直接 和 直观 的 是 空间 域 和 时 间 域 信号 ,但 某 些 时 候 , 一 些 问题 在 空间 域 
和 时 间 域 ,其 特点 不 明显 ,不 容易 观察 ,而 将 信号 变换 到 其 他 域 , 则 特征 十 分 明显 ,甚至 使 问 
题 迎 刃 而 解 。 对 于 数字 图 像 处 理 , 其 变换 域 分 析 方法 中 , 频 域 变换 法 是 应 用 最 为 广泛 的 一 类 
方法 。 在 频 域 中 也 有 多 种 变换 ,如 常用 的 傅 里 叶 变 换 .DCT 变换 ,小波 变换 等 ,每 一 种 变换 
方法 的 适应 对 象 和 侧重 解决 的 问题 各 不 相同 ,但 无 论 采 用 哪 种 变换 ,基本 目的 都 相同 , 即 所 
采用 的 这 种 变换 一 定 可 以 更 容易 、 更 方便 ,或 者 是 更 直接 、 更 直观 地 解决 所 遇 到 的 图 像 处 理 
问题 。 

数字 图 像 处 理 技术 是 一 门 应 用 性 非常 强 的 学 科 , 它 既 有 非常 广泛 的 技术 基础 ,如 信息 技 
术 、 计 算 机 科学 、 光 学 技术 等 学 科 , 也 具有 严密 的 数学 理论 基础 。 和 一 些 其 他 应 用 学 科 一 样 ， 
如 果 没 有 数学 或 者 说 离开 了 数学 ,数字 图 像 处 理 这 门 学 科 将 难以 发 展 甚至 可 能 不 存在 。 因 
此 ,在 解决 数字 图 像 处 理 的 具体 问题 时 ,数学 作为 图 像 变换 的 工具 ,发 挥 了 重要 的 作用 。 

本 章 将 围绕 变换 法 在 图 像 处 理 中 的 应 用 ,首先 介绍 傅 里 叶 变换 及 二 维 傅 里 叶 变 换 的 性 
质 和 应 用 ,然后 介绍 在 数字 图 像 处 理 中 得 到 广泛 应 用 的 DCT 变换 、K-L 变换 、 沃 尔 什 变换 、 
哈达 玛 变换 及 小 波 变换 等 。 


3.1 伟 里 叶 变 换 


傅 里 叶 变换 是 非常 重要 的 数学 分 析 工具 ,同时 也 是 一 种 非常 重要 的 信号 处 理 方法 ,在 图 
像 处 理 领域 , 它 也 是 一 类 应 用 最 为 广泛 的 正 交 变换 , 它 除 了 许多 在 工程 上 具有 重要 意义 的 独 
特性 质 之 外 ,还 具有 快速 算法 (FFT)。 傅 里 叶 变换 是 线性 系统 分 析 的 有 力 工 具 , 在 数字 图 像 
处 理 与 分 析 中 ,图 像 增强 、 图 像 恢复 、 图 像 编 码 压缩 图像 分 析 与 描述 等 每 一 种 处 理 手 段 和 方 
法 都 可 以 应 用 图 像 变 换 方 法 。 例 如 ,在 进行 图 像 低 通 滤波 、 高 通 滤波 时 ,可 以 借助 于 传 里 叶 
变换 将 在 空间 域 中 解决 的 问题 转换 到 频率 域 中 解决 。 图 像 处 理 中 的 变换 方法 一 般 都 是 保持 
能 量 守恒 的 正 交 变换 ,而 且 在 理论 上 , 它 的 基本 运算 是 严格 可 逆 的 。 借 助 于 傅 里 叶 变换 理论 
及 其 物理 解释 ,并 结合 其 他 技术 学 科 可 以 解决 或 解释 大 多 数 图 像 处 理 问 题 。 


3.1.1 连续 传 里 叶 变 换 


1. 一 维 连续 傅 里 时 变换 
车 /(z) 为 一 维 连续 实 函 数 , 则 它 的 侍 里 叶 变 换 可 定义 为 
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RO = Ee f(x) em dr (3-1 


一 般 情况 下 , 实 函 数 /(x) 经 过 傅 里 叶 变 换 之 后 ,变换 函数 下 (x) 是 一 个 复 函 数 。 傅 里 叶 
变换 是 一 个 线性 积分 变换 ,因此 应 讨论 积分 变换 本 身 的 存在 性 问题 。 侍 里 叶 变换 在 数学 上 
的 定义 是 严密 的 , 它 需要 满足 如 下 狄 利克 莱 条 件 : 

(1) 具有 有 限 个 间断 点 。 

(2) 具有 有 限 个 极 值 点 。 

(3) 绝对 可 积 。 

即 只 要 满足 上 述 条 件 的 函数 ,其 傅 里 叶 变 换 与 逆 变 换 一 定 是 存在 的 。 实 际 应 用 中 , 绝 大 
多 数 函 数 都 是 满足 狄 利 克 莱 可 积 条 件 的 。 任 何 图 像 数字 化 信号 或 相关 图 像 信 号 一 般 都 被 截 
为 有 限 延 续 且 有 界 的 信号 (函数 ) ,因此 ,常用 的 图 像 信号 和 函数 也 都 存在 傅 里 叶 变 换 。 如 果 
已 知 FCxe), 则 其 反 变换 ( 傅 里 叶 逆 变 换 ) 为 f(z)。 傅 里 叶 逆 变 换 定 义 为 


/0 = | Fedemdu (3-2) 


除了 积分 函数 和 积分 变量 的 区 分 之 外 , 正 变换 和 反 变 换 在 形式 上 的 另 一 个 重要 区 别 是 
宕 次 方 的 符号 不 同 。 
函数 /(1) 和 下 (1ww) 称 为 傅 里 叶 变 换 对 。 即 对 于 任 一 函数 /(z) ,其 傅 里 叶 变 换 FF(w) 是 唯 
一 的 ; 反之 ,对 于 任 一 函数 F(w) ,其 傅 里 叶 道 变换 /(z) 也 是 唯一 的 。 
连续 函数 /(zx) 的 傅 里 叶 变 换 F(w) 是 一 个 复 函 数 , 因 此 F(ww) 可 以 表示 为 
F(u) = R(u) iI(u) 
式 中 ,RGW) 和 了 (ww) 分 别 表示 F(w) 的 实 部 和 虚 部 ,FF(ww) 也 可 以 表示 为 指数 形式 , 即 
Flu) 一 | FO) | et 


式 中 
| FQ) |= [RG) + F001 (3-3) 
$l) = argtan (起 名 (3-4) 
式 中 ,1FG0)| 称 为 F(w) 的 模 , 也 称 为 函数 /(z) 的 全 里 叶 谱 ; $C4) 为 F(ww) 的 相 角 , 称 为 相 
位 谱 。 
令 
E(z) 一 | FO) | (3-5) 


则 ECx) 称 为 函数 /(z) 的 能 量 谱 或 功率 谱 。 

2. 二 维 连续 傅 里 叶 变 换 

车 f(x,y) 为 二 维 连 续 函 数 ,并 满足 可 积 条 件 , 则 它 的 傅 里 叶 变 换 可 定义 为 

Rt = [fy drdy (3-67 

式 中 ,w 是 对 应 于 xz 轴 的 空间 频率 变量 ; v 是 对 应 于 y 轴 的 空间 频率 变量 。 

一 般 情况 下 ,F (u,v) 是 关于 实 变量 uv 的 复 值 函 数 。 由 于 一 幅 图 像 可 用 二 维 函 数 
f(z,y) 表 示 , 所 以 Fl(u,v) 也 就 是 二 维 图 像 /(z,y) 的 傅 里 叶 变 换 或 傅 里 叶 频 谱 。 

如 果 已 知 FCx,u) ,上 且 Fue,u) 满 足 可 积 条 件 , 则 其 傅 里 叶 逆 变换 定义 为 
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Woe= 人 E Fu et dudv (3-7) 


这 时 (u,v) 和 (zyy) 称 为 傅 里 叶 变换 对 。 类 似 于 一 维 傅 里 叶 变 换 , 二 维 傅 里 叶 频 谱 
也 可 以 表示 为 
Fl(u,v) = R(u,v) til(u,v) (3-8) 
式 中 ,R(u,v) 和 了 (u,v) 分 别 表示 F(u,v) 的 实 部 和 虚 部 。F(u,v) 也 可 以 表示 为 指数 形 
式 , 即 
Fl(u,v) =| Fl(u,v) | exe 


式 中 
| Fuya) |= [RGus0) + (uv) (3-9) 
$(u) = argtan (A | (3-10》 
式 中 ,|F(u,v)| 称 为 F(u,v) 的 模 ,也 称 为 函数 fCzyy) 的 幅 值 谱 ; $(u,v) 为 (u,v) 的 相 角 ， 
称 为 相位 谱 。 
令 
下 (xu) =| Fl(usv) | 《SET 


则 EGu,v) 称 为 函数 /(z,y) 的 能 量 谱 或 功率 谱 。 
一 维 连续 函数 的 傅 里 叶 变 换 的 许多 结论 都 可 以 很 容易 地 根据 定义 推广 到 二 维 傅 里 叶 
变换 。 
例如 ,对 于 二 维 函 数 
A，1z|< 革 1y1< 子 
flzsW) = (3-12) 
0，1z|> 节 1y|> 工 


其 几何 图 形 如 图 3-1 所 示 。 


图 3-1 二 维 函数 f(z,y) 
根据 传 里 叶 变 换 的 定义 ,二 维 图 像 /(z,y) 傅 里 叶 变 换 为 
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Sm Ce ei, SC em, (3-13) 
过 vly 


Pr 
因此 ,可 得 函数 /(zx,y) 的 傅 里 叶 频 谱 为 


| FC(u,v) |= AT,T, | sin(xuTs) | | sin(xoT,) | 


Tu- TOT 
车 T, 与 ,相等 , 则 二 维 函 数 /(z,y) 的 频谱 (u,v) 的 几何 图 形 可 以 通过 将 一 维和 矩形 
信号 的 频谱 旋转 一 周 实现 ,或 者 说 ,一 维和 矩形 信号 的 频谱 是 二 维 频谱 (u,v) 的 径 向 剖面 图 形 。 


3.1.2 离散 传 里 叶 变换 


离散 傅 里 时 变换 (DFT) 是 指 对 离散 序列 进行 傅 里 叶 变换 。 由 于 计算 机 能 处 理 的 数据 
为 数字 量 或 者 说 离散 量 ,而 且 二 维 数字 图 像 已 经 将 连续 图 像 离散 化 为 像素 点 ,因此 ,连续 函 
数 的 傅 里 叶 变 换 在 计算 机 上 无 法 直接 使 用 。 因 此 ,为 了 能 在 计算 机 上 实现 数字 图 像 的 傅 里 
叶 变 换 ,必须 将 连续 函数 离散 化 。 连 续 函 数 的 傅 里 叶 变 换 是 波形 分 析 的 有 力 工具 ,离散 函数 
的 傅 里 叶 变换 将 数学 与 计算 机 技术 紧密 联系 在 一 起 ,为 傅 里 叶 变换 这 一 强 有 力 的 数学 工具 
开辟 了 一 条 宽阔 的 实用 之 道 , 使 傅 里 叶 变 换 这 一 数学 工具 将 发 挥 更 大 的 作用 。 

1. 一 维 离散 傅 里 叶 变 换 

前 面 介绍 了 一 维 连 续 函 数 /(z) 的 傅 里 叶 变 换 ,/(z) 是 在 一 ~ 十 无 限 区 间 上 连续 ， 
函数 值 / 是 连续 的 ,计算 机 无 法 直接 对 连续 函数 进行 运算 。 因 此 ,必须 对 连续 函数 /(zx) 进 
行 离散 化 处 理 。 

若 以 Az 为 采样 间隔 ,从 一 ce 一 十 ce 对 /(z) 进 行 等 间隔 采样 , 则 可 将 连续 函数 离散 化 。 
一 般 情况 下 不 会 对 这 无 穷 多 个 采样 值 进行 同样 的 关注 , 若 以 某 个 起 点 ze 开始 的 采样 值 是 所 
关注 的 值 , 则 称 该 起 点 ze 的 采样 值 为 离散 采样 序列 的 第 1 个 样本 值 ,其余 采 样 点 以 此 类 推 ， 
(zo 十 Az) 点 的 采样 值 为 第 2 个 采样 值 , (ze 十 2Az) 点 的 采样 值 为 第 3 个 采样 值 ……[zo 十 
(N 一 1)Azj] 点 处 的 采样 值 为 第 N 个 采样 值 。 这 样 就 得 到 了 具有 N 个 采样 值 的 离散 序列 。 
将 N 个 采样 值 排列 如 下 : 

WA 
上 述 序列 可 以 表示 为 
f(xzotnAr), n=0,1,2,3,°…,N—1 

由 于 zo 是 一 个 确定 的 起 点 时 刻 ,Ax 是 采样 间隔 ,这 两 个 量 都 是 常量 ,上 述 序列 的 表达 

式 中 只 及 是 变量 ,因此 ,离散 采样 序列 可 以 直接 表示 为 FCz) , 即 
fn) = f(zotnAr), n=0,1,2,3,…,N—1 (3-15) 
为 了 和 数字 图 像 的 其 他 表示 方法 一 致 ,可 以 将 代 蔡 , 即 序列 可 以 表示 为 
f(x) = Crzo 十 zAz)， 工 一 0,1,2,3，…,N 一 1 (3-16) 


(3-14) 
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由 此 可 得 一 维 离散 序列 fCz)(z=0,1,2.3,…,N 一 1) 的 傅 里 叶 变换 定义 为 
Fo = >) ze，v 一 0,1,2,3,…,N 一 1 (3=177 


式 中 
F(u) = F(u tuAu), wu 一 0,1,2,3,…… 太 一 1 
若 已 知 频率 序列 FF(w) (w= 二 0,1,2,3,… ,NN 一 1), 则 离散 序列 FCx) 的 傅 里 叶 逆 变 换 定 


义 为 
7 一 再 22F FlDe, r=0,1,2,3,.…,N—1 (3-18) 
式 中 ,7Cz) 和 下 (zx) 称 为 傅 里 叶 变换 对 ; Ax 和 Au 分 别 为 空间 域 采 样 间隔 和 频率 域 采样 间 
隔 ,两 者 之 间 满 足 
三 
Ar 一 (3-19) 
令 
W = 二 Ee 询 (3-20) 
离散 傅 里 叶 变 换 可 以 写 为 如 下 形式 : 
正 变换 : 
Bd DW , 0 (3-21) 
f(z) = SFOww ，z 一 0,1,2,3,N 一 1 (3-22) 


根据 欧 拉 公式 ， 傅 里 叶 变 换 可 以 写 为 
Feo = ST fen [cos jsin RE], w=0,1,2,3,…,N—1 


由 此 可 知 ,离散 序列 /(x) 的 傅 里 叶 变 换 (wu) 依 然 是 离散 序列 ,而 且 通 常情 况 下 是 一 
复数 序列 ,与 连续 傅 里 叶 变 换 类 似 ,F(ww) 可 以 表示 为 
F(u) = R(u) + jiI(u) 
式 中 ,序列 RGu) 和 I(w) 分 别 表示 离散 序列 下 (w) 的 实 序列 和 虚 序 列 , 序 列 Fo) 还 可 以 表示 


为 指数 形式 , 即 
FQ) 一 | FO | es (3-23) 
式 中 
| FG) |= [RG + EG) (3-24) 
IT(u) 中 
$(u) 一 argtan (起 避 ] (3-25) 


式 中 ,|F(w) | 称 为 F(w) 的 模 , 又 称 为 序列 /(z) 的 频谱 或 傅 里 叶 幅 度 谱 ; %(zx) 称 为 FCu) 的 
相 角 ,或 称 为 序列 /(z) 的 相位 谱 。 


公 


一 | Play (3-26) 
则 频谱 的 平方 (4) 称 为 序列 F(z) 的 能 量 谱 或 功率 谱 。 


到 
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2. 二 维 离散 傅 里 时 变换 
根据 一 维 离散 傅 里 叶 变 换 的 定义 和 二 维 连续 傅 里 叶 变 换 理论 ,对 于 一 个 具有 MX N 个 样 
本 值 的 二 维 离 散 序列 f(x,y) (z=0,1,2,3,…,M 一 1; y 二 0,1,2,3,… ,NN 一 1) ,其 傅 里 叶 变 换 为 


M-1 N-1 


Flusw) = >) >) flrsy es(WR), w=0,1,2,3,.,M—1; v= 0,1,2,3,.%,N—1 


i 
(3-27) 
式 中 
Fl(u,v) = F(wo tuAusvo tvAv), 一 0,1,2, 3 ,MO—1;v=0,1,2,3,°…,N—1 
车 已 知 频率 二 维 序列 FCusv)(u==0,1,2,3,…,M 一 1; v= 二 0,1,2,3,…,N 一 1), 则 二 维 
离散 序列 F(u,v) 的 傅 里 叶 逆 变换 定义 为 


flzsy) = FH poe Ft), z=0,1,2,3,…,M—1 y=0,1,2,3,.…,N—1 
= 和 和 ps 
(3-28) 
式 中 ,wu 是 对 应 于 xz 轴 的 空间 频率 分 量 ; v 是 对 应 于 y 轴 的 空间 频率 分 量 。 
f(z,y) 和 (u,v) 称 为 傅 里 叶 变 换 对 ,Axz 和 Au 分 别 为 空间 域 采样 间隔 和 频率 域 采样 
间隔 ,两 者 之 间 满 足 


(3-29) 


根据 欧 拉 公式 ,二 维 离散 序列 /(x,y) 的 傅 里 叶 变 换 F(u,v) 依 然 是 二 维 离散 复数 序列 ， 
(u,v) 可 以 表示 为 
Fl(u,v) = R(u,v) + il(u,v) 
式 中 ,序列 RGu,v) 和 I(u,v) 分 别 表示 离散 序列 FC(u.v) 的 实 序列 和 虚 序 列 。 则 同样 可 得 二 
维 序列 /(z,y) 的 频谱 ( 傅 里 叶 幅 度 谱 ) 、 相 位 谱 和 能 量 谱 ( 功 率 谱 ) 分 别 为 


| F(u,v) |= [R’ (u,v) +r(w] (3-30) 
IT(u,v) " 

$l(u,v) 一 argtan (A C3-31) 

E(u,v) 一 | F(u,v) |? (3-32) 


3.1.3 二 维 DFT 的 性 质 


根据 传 里 叶 变换 的 定义 ,二 维 傅 里 叶 变 换 具 有 与 一 维 傅 里 叶 变 换 相 似 的 特性 。 数 字 图 
像 处 理 中 需要 应 用 很 多 二 维 离散 傅 里 叶 变 换 的 性 质 ,充分 理解 和 掌握 这 些 性 质 是 非常 必要 
的 。 二 维 离散 傅 里 叶 变 换 的 主要 特点 如 下 。 

1. 线性 特性 

如 果 二 维 离散 函数 f1(z,y) 和 f(z,y) 的 全 里 叶 变 换 分 别 为 Fi (u,v) 和 FF (u,v), 则 存 
在 以 下 线性 性 质 : 

DEFT[A 广 Cz,y) 十 已 户 (zy)]= DFT[LA 广 (z,y)] 十 DFTLA: fi (zx,y)] 
= kiFi(u,v) tk F, (u,v) 
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工 一 0,1,2,3,…,M 一 1; y=0,1,2,3,.…,N—1 


u=0,1,2,3,……,M—1;v=0,1,2,3,…,N—1 C35 
应 用 线性 性 质 时 应 注意 ,Fi (uv) 十 koFs (u,v) 不 能 超过 图 像 显 示 器 所 允许 的 最 大 
值 ,否则 可 能 造成 图 像 信 息 损失 。 


2. 比例 性 质 
如 果 二 维 离散 函数 /(z,y) 的 傅 里 叶 变 换 为 F(u,v), 则 存在 以 下 比例 性 质 : 


u Uv 


DFT[f(azr ,by)] = 基 位 汉 )， o_O 


b 
并 一 0,1,2,3,…,M 一 1; y 王 0,1,2,3,… ,太一 1 
4 一 0,1,2,3,…,M 一 1; 一 0,1,2,3,… ,六 一 1 (3-34) 
式 中 , 若 取 
a = 一 1 
\ 一 一 1 
则 比例 特性 表现 为 
DFTLF( 一 z, 一 妇 ] = F(—u,—v) (3-35) 
3. 平移 性 质 


如 果 二 维 离散 函数 /(z,y) 的 传 里 叶 变 换 为 (u,v), 则 存在 以 下 平移 性 质 : 


DFT[f(x,y)e”” 次 + 守 ) ]= Fl(u— uv— vo) 
z= 01235"5M—1; 7 一 0,172) 3 入 一 1 


一 0,1,2,3,…,M 一 1; uv 一 0,1,2,3,…,N 一 1 (3-36) 
对 于 逆 变换 ,也 存在 同样 的 性 质 : 
DFT[/(zx— zo,y— yo) = Fl(u,v)e (H+) (3-37) 


二 维 傅 里 叶 变 换 的 移 位 特性 表明 , 当 用 e*( 守 + 属 ) 乘 以 /(z,y) ,然后 再 进行 乘积 的 离 
散 传 里 叶 变 换 时 ,可 以 使 空间 频率 域 ww 平面 坐标 系 的 原点 从 (0,0) 平 移 到 (uo ,vo ) 的 位 置 。 


ep 对 于 傅 里 叶 道 变换 , 当 用 e- 让 ( 竺 + 寻 ) 乘 以 下 (wu) ,并 求 此 乘积 的 离散 傅 里 叶 反 变 
换 , 可 以 使 空间 域 x-y 平面 坐标 系 的 原点 从 (0,0) 平 移 到 (zo ,yo) 的 位 置 。 逆 变换 的 移 位 特 
性 还 表明 ,图像 fCz,y) 平 移 之 后 为 /(z 一 zo，y 一 yo) ,但 平移 之 后 的 傅 里 叶 幅 度 谱 没有 发 生 
任何 变化 ,而 仅仅 是 相位 谱 产 生 了 一 定 的 相 移 特性 
二 维 离散 传 里 叶 变 换 的 移 位 特性 在 数字 图 像 处 理 中 具有 重要 的 应 用 价值 。 例 如 ,为 方 
便 地 观察 数字 图 像 的 傅 里 叶 变 换 结果 , 经 常 需要 将 空间 频率 平面 坐标 系 的 原点 (0,0) 移 到 
(CM/2,NV/2) 的 位 置 , 此 时 ,可 以 取 值 为 


根据 移 位 特性 , 则 对 应 于 空间 域 乘 以 因子 
(和 和) = ey 一 (一 中 


这 时 移 位 特性 表现 为 
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DFT[f(z, ye”(+e)] = DFT Df (zr,y)] = Fu— u,v — vo) 
工 一 0,1,2,3,…,M 一 1; y 一 0,1,2,3,…,N 一 1 
2 3 M 一 137 =0,1,2,3，…， 人 一 1 (3-38) 

将 FCz,y) 乘 以 一 个 简单 的 因子 (一 1)*+> ,然后 对 乘积 进行 傅 里 叶 变 换 ， 
就 可 以 将 空间 域 频率 平面 坐标 系 的 原点 平移 到 空间 频率 域 的 MX N 方 阵 中 心 。 

例 3-1: 傅 里 叶 变换 的 频谱 分 布 特性 

对 如 图 3-2(a) 所 示 图 像 进 行 傅 里 叶 变 换 ,图 3-2(b) 为 未 进行 移 位 的 傅 里 叶 变 换 幅 值 

普 , 幅 值 谱 图 的 四 个 角 为 低频 点 ,图 3-2(c) 为 先进 行 移 位 再 进行 傅 里 叶 变换 的 幅 值 谱 ,频谱 
心 位 于 幅 值 谱 图 的 中 心 点 ,图 3-2(d) 为 图 3-2(c) 幅 值 谱 的 三 维 显示 ,图 3-2(e) 为 三 维 
幅 值 谱 沿 u 频率 轴 剖 面 。 


式 (3-38) 表 明 ， 


(a) 原 始 图 像 


(b) 未 移 位 传 里 叶 幅 值 谱 (©) 移 位 后 传 里 叶 幅 值 谱 


maguse Laan 


0 | | 


(d) 移 位 后 幅 值 谱 三 维 图 (e) 三 维 幅 值 谱 沿 频 率 轴 剖 面 


图 3-2 傅 里 叶 变 换 及 移 位 特性 
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4. 可 分 离 性 
如 果 MXN 二 维 离散 函数 f(z,y) 的 傅 里 叶 变 换 为 F(x,u) , 则 存在 以 下 可 分 离 性 质 : 
Ai N=l 
Flusv) = >) >) f(r ye ir(R) 
M1 N=-—1 
2{| S/o es) 
u=0,1,2,3,…,M—1, v=0,1,2,3,…,N—1 (3-39) 


二 维 传 里 叶 变 换 的 可 分 离 特性 表明 ,一 个 二 维 傅 里 叶 变 换 可 通过 二 次 一 维 傅 里 叶 变 换 
来 完成 , 即 第 一 次 先 对 y 进行 一 维 傅 里 叶 变 换 


Ac1 
F(x,v) = Df ry 


z=0,1,2,3,…,M—1; v=0,1,2,3,%…,N—1 (3-40) 
然后 ,再 在 此 基础 上 对 zx 进行 一 维 傅 里 叶 变 换 
M-1 


Flusv) = >) f(zov)e i 
x=0 


u=0,1,2,3,°…*,M—1;v=0,1,2,3,.…,N—1 (3-41) 
上 述 过 程 也 可 以 先 对 y 进行 傅 里 叶 变换 ,然后 再 对 zx 进行 变换 。 变 量 分 离 步骤 如 图 3-3 
所 示 。 
MX NN 二 维 离散 
序列 /Ge Bu SM TT Gy 
按 行进 行 一 维 | 按 列 进 行 一 维 
DFT 变换 DFT 变换 
图 3-3 二 维 离散 传 里 叶 变换 的 分 离 特 性 
根据 分 离 性 质 可 以 表示 为 
Fl(u,v) = DFT,{(DFT-LFGz,y)]} = DFT, {DFT,[Lf(z,y)]} (3-42) 
车 已 知 频率 二 维 序列 (u,v), 则 二 维 可 分 离 性 对 伟 里 叶 逆 变换 同样 适应 。 
AM-1 N-—1l 
flr = 泥 DP) FO ve ir(N 
M-1 N=-1 
一 3 {Drewers es) 
工 一 0,1,2,3,…,M 一 1; y 王 0,1,2,3,… ,太一 1 (3-43) 


道 变 换 的 分 离 性 也 同样 可 以 分 解 为 两 次 一 维 侍 里 叶 变 换 : 
f(x,y) = DFT {DFTA LF (u,v0)] = DFT# {DFTH [LF (u,v0)] 


工 一 0,1,2,3,…,M 一 1; y=0,1,2,3,…,N—1 (3-44) 
5. 周期 性 


如 果 二 维 离散 函数 /(z,y) 的 健 里 叶 变 换 为 F(wu,v), 则 伟 里 叶 变 换 及 其 逆 变 换 存在 如 
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下 周期 特性 : 
Flu,v) 一 下 (十 AM 十 AN) 
u=0,1,2,3,-…,M—1;v=0,1,2,3,.…,N—1 (3-45) 
f(xy) = F(z+hkM,y+kN) 
工 一 0,1,2,3,…,M 一 1; y 一 0,1,2.3,… ,太一 1 (3-46) 
式 中 ,ki 、kz 均 为 正 整数 。 
6. 共 斩 对 称 性 


如 果 二 维 离散 函数 /(z,y) 的 傅 里 叶 变换 为 F(u,v), 则 傅 里 叶 变 换 存 在 共 罗 对 称 性 : 
Fasv) = FF" (—u; CO—W) 


& 一 0,1,2,3,…,M 一 1; v= 0,1,2,3,.…,N—1 (3-47) 
是 
| FQ(usv) |=| F* (一 如 一 如) | 
一 0,1,2,3,…,M 一 1; v=0,1,2,3,.…,N—1 (3-48) 
7. 旋转 不 变性 


如 果 二 维 离 散 函 数 A(z,y) 的 傅 里 叶 变换 为 F(u,v), 则 二 维 傅 里 叶 变 换 对 之 间 存 在 旋 
转 不 变性 。 考 虑 到 极 坐标 表示 二 维 图 形 的 旋转 特性 的 方便 性 ,为 此 ,将 空间 域 和 空间 频率 域 
都 改 为 用 极 坐标 表示 。 在 空间 域 直角 坐标 与 极 坐标 的 变换 关系 为 


工 一 rcos0 
(3-49) 
y= rsin0 


这 样 , 图 像 f(z,y) 可 以 表示 为 f(~,0)。 同 样 ,空间 频率 域 的 F(w,v) 采 用 极 坐 标 可 以 
表示 为 F(o,g)。 二 维 离散 傅 里 叶 存 在 如 下 旋转 特性 : 

DFT[f(r,0+0)] = Flp,$+0) (3-50) 

即 如 果 /(z,y) 旋 转 一 个 角度 0 , 则 对 应 的 傅 里 叶 变 换 (u,v) 也 同样 旋转 相同 的 角度 p 。 

反之 亦 然 。 


DFT[F(p,$+0)] = f(r,0+0) (3-51) 
例 3-2: 傅 里 叶 变 换 的 旋转 不 变性 
如 图 3-4 所 示 是 傅 里 叶 变换 旋转 不 变性 的 示例 ,图 3-4(a) 为 原始 图 像 , 图 3-4(b) 是 对 原 
始 图 像 进 行 离散 傅 里 叶 变换 的 结果 ,图 3-4(c) 为 将 原始 图 像 旋转 45" 角 ,图 3-4(d) 为 旋转 之 
后 的 傅 里 叶 变换 ,可 以 看 出 图 3-4(b) 与 图 3-4(d) 之 间 同 样 是 45 的 旋转 关系 。 
8. 微分 性 质 
如 果 二 维 离散 函数 f(z,y) 的 傅 里 叶 变换 为 FCu,u) , 则 傅 里 叶 变 换 具 有 如 下 微分 性 质 


9 - 
DFT [SAS ]= (j2m)"F (uv) 
& 一 0,1,2,3,……M 一 1; v=0,1,2,3,:*…,N—1 (3=52) 


9"f (zr, 0 


DFT[ 一 5 = (j2xv)"F (u,v) 


= 0 Dy 0 (3-53) 
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(b) DFT 变换 


(0) 原始 图 像 旋转 45” (d) 旋转 之 后 DFT 变换 结果 


图 3-4 傅 里 叶 变 换 的 旋转 不 变性 


9. 平均 值 性 质 
如 果 MX N 二 维 离散 函数 /(z,y) 的 傅 里 叶 变 换 为 F(wu,v) ,函数 的 平均 值 定 义 如 下 : 
M1 N-1 
F(zsy) apc (3-54) 
则 二 维 离散 傅 里 叶 变 换 具 有 如 下 性 质 : 
M-1 N-—l 
F(0,0) = >) >)/(z,y) = MN f(x,y) (3-55) 


即 
f(z,y) = 二 00) 
也 就 是 说 ,二 维 离散 函数 的 平均 值 等 于 其 傅 里 叶 变换 在 频率 原点 
10. 卷 积 定理 
如 果 二 维 离散 函数 fCz,y) 和 jz,y) 的 傅 里 叶 变 换 分 别 为 FCu,u) 和 吾 (x,u), 则 
f(zsy) 和 h(x,y) 之 间 的 卷 积 可 以 通过 其 傅 里 叶 变 换 (u,v) 和 甩 (u,v) 进 行 计算 。 


z 
记 
2 


DFT[fCzx,y) x h(z,y)] = Flusv) Husv) (3-56) 
反 过 来 ,也 存在 如 下 关系 : 
DFT[F(usv) x HGeyo] = flrs yh(r,y) (3-57) 


11. 相关 定理 
如 果 二 维 离散 函数 f(z,y) 的 傅 里 叶 变 换 为 F(w,v), 则 傅 里 叶 变 换 对 自 相 关 和 互相 关 
运算 分 别 具 有 如 下 特性 : 
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2) 


互相 关 
Jr)OHMCz WEF) H’ (u,v) (3-58) 
Flu OH(u DOf (zr, yh’ (x,y) (3-59) 

自 相关 
frW OF x SF DF (uv) 一 | Fu,v) | (3-60) 
| fx;y) OF(u,v) OF (uv) (3-61) 


12. 帕 萨 瓦 (Parseval) 定理 


如 
性 质 : 


由 
3 
相 


傅 里 叶 
例 3-3: 傅 里 叶 变 换 的 综合 实例 


果 MXN 二 维 离散 函数 /(z,y) 的 传 里 叶 变 换 为 (u,v), 则 侍 里 叶 变 换 具有 如 下 


We (3-62) 


加 | | | | 
萨 瓦 定理 表明 ,进行 二 维 伟 里 叶 变 换 后 函数 的 能 量 没有 改变 。 
.1.4 图像 伟 里 叶 变 换 综合 实例 


对 于 一 维 信号 的 傅 里 叶 变 换 , 二 维 傅 里 叶 变换 有 一 些 新 特性 。 为 了 全 面 理解 和 掌握 
变换 , 现 给 出 一 例 傅 里 叶 变换 的 综合 实例 。 


如 


0, 由 幅 值 谱 进行 


图 3-5(a) 所 示 为 原始 图 像 , 图 3-5(b) 所 示 为 傅 里 叶 变换 的 幅 值 谱 ,假定 相位 为 常数 
傅 里 叶 逆 变换 的 重建 图 像 如 图 3-5Cc) 所 示 ; 图 3-5(d) 是 傅 里 叶 变换 的 相位 


谱 , 假 定 幅 值 为 常数 ,由 相位 谱 逆 变 换 的 重建 图 像 如 图 3-5(e) 所 示 ; 由 幅 值 谱 和 相位 谱 道 变 
换 的 重建 图 像 如 图 3-5(f) 所 示 。 


(a) 原始 图 像 


(b) 傅 里 叶 变 换 幅 值 谱 (c) 幅 值 谱 逆 变 换 
图 3-5 图 像 傅 里 叶 变 换 实 例 
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(qd) 傅 里 叶 变换 相位 谱 (e) 相位 谱 逆 变 换 


天 
(人 f) 幅 值 谱 和 相位 谱 重建 图 像 
图 3-5( 续 ) 


本 实验 结果 表明 , 基 0 和 幅 值 谱 北 变换 的 图 像 3-5(f) 和 原始 图 像 3-5(a) 误 差 不 
大 ,假定 相位 为 常数 0, 由 幅 值 谱 进 - 逆 变 换 的 重建 图 像 3-5(c) 和 原始 图 像 完 全 不 一 
样 ,而 假定 幅 值 为 常数 ,由 相位 谱 重建 图 像 3-5(d) ,虽然 与 原始 图 像 在 灰 度 值 方面 
有 较 大 的 误差 ,但 图 像 的 基本 轮廓 和 边缘 却 相似 。 


3.2 ”离散 余弦 变换 


DFT 变换 是 频谱 分 析 的 有 力 工 具 , 但 DFT 变换 是 基于 复数 域 的 运算 ,因而 给 实际 
运算 带 来 了 不 便 。 因 此 ,工程 上 特别 需要 各 种 在 实数 域内 的 变换 ,DCT 变换 就 是 其 中 
-种 。DCT 变换 除了 具有 一 般 正 交 变 换 的 性 质 之 外 ,还 具有 许多 3 DET 
变换 阵 的 基 向 量 很 近似 于 Toeplitz 矩阵 的 特征 向 量 , 很 好 地 体现 了 人 类 语音 信号 
依 全 号 的 相 大 特性 。 因此 ,许多 学 者 认为 ,在 语音 和 图 像 信 号 处 理 方面 ,DCT te 
为 是 准 最 佳 变换 。 而 且 ,DCT 变换 还 可 以 通过 实 偶 函 数 的 傅 里 叶 变 换 建立 与 FFT 变 
换 之 间 的 关系 。 

DCT 变换 由 Ahmed 和 Rao 于 1974 年 首先 提出 ,随后 就 得 到 了 广泛 的 应 用 ,在 许多 领 
域 ,DCT 变换 被 认为 是 一 种 准 最 佳 变 换 。 在 近年 颁布 的 一 系列 视频 压缩 编码 的 国际 标准 建 
议 中 ， 和 DCT 变换 作为 其 中 的 一 个 基本 处 理 模 块 。DCT 变换 除 上 述 优点 之 外 ,还 具有 许 
多 特点 ,如 DCT 为 实数 变换 、 变 换 和 矩阵 确定 (与 变换 对 象 无 关 )、 具 有 多 种 快速 算法 ,二 维 
DCT 还 是 一 种 可 分 离 的 变换 等 。 
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3.2.1 一 维 DCT 变换 


一 维 DCT 的 变换 核定 义 为 
_ 2 (2z++ Durx 
g(Xu) = C(u) Neos[ 2N ] 
Xu=0,1,2,3,.…,N—1 (3-63) 
式 中 
1 
一 ，& 一 0 
CCo) = WW2 (3-64) 
1， 天 0 


若 f(zx)(z 二 0,1,2,3,…,N 一 1) 为 N 点 离散 序列 , 则 一 维 DCT 变换 的 定义 为 
2 站 (2z 十 1) 
F(u) = CGO) [IN eos [~ aN | 


1 (3-65) 
式 中 ,F(u) 是 第 “个 余弦 变换 系数 ; u 是 广义 频率 变量 。 
一 维 DCT 道 变换 定义 为 
N=1 
f(z) = [v2 tore so] 
z=0,1,2,3,.,N—1 (3-66) 


根据 式 (3-65) 和 式 (3-66) 可 以 看 出 ,一 维 DCT 正 变换 与 道 变换 的 核 相同 。 与 DFT 变 
换 一 样 ,DCT 变换 也 可 以 写成 如 下 矩阵 形式 : 
F=Gf (3-67) 
式 中 
F= [F(0),F(), FC2),., FON— 1)] 


VN 1 i 1] ] 
/本 e( 菏 ) cos( 藻 ] a eos (2)| 
G= VN /到 ( 苔 ) cos[ 里 ] vse eos (3)| 


2 CN 一 Dr CN 一 1)3x (N— DN— Dx 
= LO DD, fy FON—1)] 
3.2.2 二 维 DCT 变换 


一 维 DCT 变换 可 以 很 方便 地 推广 到 二 维 DCT 变换 , 设 二 维 离散 图 像 序列 为 {f(x,y) 
(z 一 0,1,…,M 一 1; y= 二 0,1,…,N 一 1)}, 则 二 维 DCT 正 变换 核 为 


_ ee (27r + Durx (2z++ Dvrx 
gCryyyuyu) 一 MN CC eos[ 2M ]eos| 2N ] 
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ZU 一 0,1,2,3,…,M 一 1; yu 一 0,1,2,3,… ,六 一 1 (3-68) 
其 中 ,CQw) 和 Clv) 的 定义 与 式 (3-64) 相 同 。 
二 维 DCT 正 变换 为 
2 A (27z + Durx (27r+ 1)vrx 
Fl(u,v) = 2 2ceceeosl 2M ]eos[ 2N ] 
u=0,1,2,3,…,M—1; v=0,1,2,3,°",N—1 (3-69) 
二 维 DCT 道 变换 定义 形式 为 
zi = /页 晤 rweewceweos [Bo] 
I=0,1,2,3,-…,M—1;y=0,1,2,3,.…,N—1 (3-70) 
与 一 维 DCT 变换 一 样 ,二 维 DCT 变换 也 可 以 写成 如 下 矩阵 形式 : 
F=fGT Ca-713 


根据 式 (3-69) 和 式 (3-70) 可 以 看 出 ,二 维 DCT 正 变换 与 逆 变 换 的 核 也 相同 ,而 且 是 可 
分 离 的 , 即 可 分 离 以 后 进行 运算 。 


g(X,yruUrv) 一 [eC weos [eos [= 专权] 


Ea -he (2z+ Durx EF (2z+ Lvrx 
| [meeos| 2M ]}{ [NC weos[ 2N ]) 


= g(xu) gs(y,0) (3-72) 
TU 一 0,1,2,3,……M 一 1; y,v =0,1,2,3,…,N—1 
与 DFT 变换 类 似 , 根 据 可 分 离 性 原理 ,一 次 二 维 DCT 变换 可 以 通过 二 次 一 维 DCT 正 
变换 完成 。 其 算法 流程 如 图 3-6 所 示 。 


MXN 二 维 离散 
序列 f (xy) 


置 EL 
Fw) | | Foojr La 


F (uv) | 


| | 和 1 
| | 按 列 进行 一 维 ! 
! DCT 变换 ，! ! DCT 变 换 | 


3-6 ”DCT 变换 的 分 离 运算 流程 


3.2.3 DCT 变换 的 快速 算法 


DCT 变换 根据 定义 也 可 以 直接 进行 计算 ,但 计算 量 非常 大 ,在 实际 应 用 中 很 不 方便 。 
目前 ,基于 DCT 的 快速 算法 有 许多 种 ,由 于 FFT 算法 是 一 个 应 用 广泛 且 非 常 成 熟 的 快速 算 
法 ,因此 许多 DCT 算法 也 是 基于 FFT 的 原理 建立 起 来 的 。 具 体 步 骤 如 下 : 

(1) 将 离散 序列 /(z) 延 拓 为 如 下 形式 的 2N 点 序列 。 


Flr)s B= O02 N—1 
fi(z) = (3-73) 
0 X= N,N+T1,…,2N—1 


(2) 根据 一 维 DCT 的 定义 ,对 延 拓 序列 f(x) 进行 DCT 运算 。 
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当 x 一 0 时 
N=-—1 
F(0) = 启 >fweos[ 竺 才 于 |] (3-74) 
z=0 
当 w==1,2,3,…,N 一 1 时 ,有 
N-1 
2 ; (2z 十 1)ur 
F(w) = C(u) Neos[ 2N ] 
太守 Qzrt+Dury, 2x + Dur 
.可 2 。 
六 之 /zeos[ 2N ] N20 cos| DN ] 
2N—1 
ee 4 (2z+ Durx 
= NAVs aN ] 
2N—1 
i ee (27+ Durx 
= NRe{ hc)eos[ EH ]| 
2 2N-—1 
= [rel ecwees)) 
N zx=0 
= [Re{e FFTL/ (7)])} 
(一 0,1,2,3,… ,入 一 1) C3=75) 


因此 ,DCT 快速 算法 可 以 通过 对 延 拓 序列 /1(z) 进 行 FFT 运算 完成 ,即将 N 点 的 序列 
f(z) 延 拓 为 2N 点 的 序列 [1(zx) 后 ,对 序列 f1(x) 进 行 FFT 运算 ,再 将 结果 乘 以 e- 中 并 取 


其 实 部 ,然后 乘 以 /就 是 DCT 运算 的 结果 。 


对 于 DCT 道 变换 (又 称 为 IDCT) ,也 可 以 采取 类 似 的 方法 进行 快速 运算 。 
(1) 将 离散 序列 下 (ww) 延 拓 为 如 下 形式 的 2N 点 序列 。 
F(z), wu=0,1,2,3,.…,N—1 


Fi(u) = | 
0， u= N,N++1,.…,2N—1 


(2) 根据 一 维 IDCT 的 定义 ,对 延 拓 序 列 Fi(w) 进 行 IDCT 运算 ,公式 为 


扰动 一 (J =) + /R(T Goer (3-76) 
3.2.4 二 维 DCT 的 频谱 分 布 


以 图 像 傅 里 叶 变换 为 基础 ,二 维 DCT 的 频谱 特性 比较 好 理解 , 现 以 一 个 DCT 变换 实 
例 来 分 析 其 频谱 分 布 。 

例 3-4: DCT 变换 实例 
图 3-7(a) 为 原始 图 像 , 图 3-7(c) 为 原始 图 像 旋转 45" 角 的 图 像 ,图 3-7(b) 和 图 3-7(d) 分 
别 为 图 3-7(a) 和 图 3-7(c) 的 DCT 变换 。 对 于 DCT, 频 率 (0,0) 点 对 应 于 频谱 原点 (x 一 0， 
2 一 0) ,低频 在 左上 角 ,高 频 在 右 下 角 ,(CM 一 1,N 一 1) 点 对 应 于 高 频 成 分 ; DCT 低频 系数 值 
较 大 ,高 频 系数 值 较 小 , 即 能 量 主要 集中 在 低频 ,从 左上 角 往 右 下 角 频 率 升 高 .能 量 降低 。 根 
据 DCT 变换 原理 ,其 运算 相当 于 对 带 有 中 心 偏 移 的 实 偶 函 数 进行 二 维 DFT 运算 ,因此 ， 
DCT 的 频谱 分 布 与 DFT 相差 一 倍 。 
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换 ， 


(b) DCT 变 换 


(c) 原始 图 像 旋转 45” (d) DCT 变 换 


图 3-7 DCT 变换 的 频谱 分 布 


3.3 离散 K-L 变换 


K-L 变换 (Karhunen-Loeve transform) 是 数字 图 像 处 理 中 具有 广泛 应 用 的 一 类 重要 变 
又 称 为 特征 向 量变 换 、 主 分 量变 换 或 答 特 林 变 换 。K-L 变换 既 有 连续 形式 的 变换 也 有 离 


散 形式 的 变换 , 它 是 完全 从 图 像 的 统计 性 质 出 发 实现 的 变换 。 数 字 图 像 中 应 用 的 主要 是 离 
散 K-L 变换 , 它 的 重要 优点 是 去 相关 性 好 ,该 变换 在 数据 压缩 ,图像 旋 转 、 遥 感 多 光谱 图 像 


的 玫 


# 征 选择 和 统计 识别 等 方面 具有 重要 意义 。 
3.3.1 K-L 变换 的 基本 原理 
在 实际 应 用 中 ,二 维 图 像 可 以 视 为 随机 场 。 一 幅 NXN 的 图 像 /(z,y) 在 某 个 通信 信 


道中 传输 了 M 次 ,由 于 受到 随机 噪声 的 干扰 ,接收 到 的 可 能 是 一 个 受 干扰 的 图 像 随机 变量 
的 样本 集合 : 


(fix y) ,foxy fu (x,y)} 
对 第 i 次 获得 的 图 像 f(z,y), 可 以 用 N:X1 维 向 量 X; 表示 : 
X; 一 [ 户 (0,0) ,fi(0,1) ,es fiON—1),f1.0) ,fi Ds fi No—1),., 
fi(N—10O0,fiN—1,.1),.%,fi(N—1,N—1)] 
车 以 X; 表示 第 i 次 获得 的 图 像 /(z,y) 中 的 第 j 行 的 NN 个 分 量 , 则 上 式 为 
= DR as 斋 交 和 
根据 概率 论 和 数理 统计 知识 ,图 像 随机 场 信号 的 随机 变量 之 间 的 相关 程度 可 以 采用 协 


方差 矩阵 表示 ,因此 ,向量 瑟 的 协 方差 矩阵 的 定义 为 


出 
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C= E[(X—m)(X—m,)"] (3-77) 
式 中 ,C, 是 N?XN? 对 称 方 阵 ,对 角 线 上 的 元 素 Co 表示 第 个 分 量 的 方差 ,C, 表 示 第 n 个 
元 素 与 第 m 个 元 素 之 间 的 协 方差 ; 已 表示 数学 期 望 运算 ; m, 表示 向 量 X 的 平均 值 。 
向 量 X 的 平均 值 定义 为 


m, = E[X] (3-78) 
对 于 M 幅 数 字 图 像 ,向 量 立 的 均值 m, 可 以 用 全 部 样本 的 平均 值 近似 计算 , 即 
2 xX 
Dy = EEL] 本 (3-79) 


向 量 X 的 协 方差 矩阵 C。 可 以 采用 同样 的 方法 计算 , 即 
C= E[(X—m)(X—m,)’] 


M 
~ LIELX— m)(X—m.)"] 
Mt 


式 中 ,m, 是 N? 个 元 素 的 向 量 。 

C: 是 N?XN? 实 对 称 方 阵 , 所 以 总 可 以 求 出 协 方差 矩阵 的 N? 个 特征 值 及 其 对 应 的 正 
交 特 征 向 量 。 设 特征 值 ti( 王 1,2,…,N2) 对 应 的 特征 向 量 为 e:(i 二 1,2,…,N?), 并 将 特征 
值 按 递减 排序 , 即 二 X42 二 … 二 Ah。 则 定义 K-L 变换 和 矩阵 A 如下: 


eNz1 EN’2 “** @NiN’ 
式 中 ,ej 表示 第 i 个 特征 向 量 的 第 j 个 分 量 。 
于 是 ,可 得 K-L 变换 形式 为 
Y= A(X—m.) (3-80) 
向 量 Y 的 形式 与 X 相同 。 该 变换 可 直接 理解 为 ,由 中 心 化 图 像 向 量 (X 一 m, ) 与 变换 矩 
阵 4 相 乘 即 可 得 到 变换 后 的 图 像 向 量 Y。 


3.3.2 K-L 变换 的 性 质 


由 于 K-L 变换 的 变换 矩阵 4 是 由 协 方差 矩阵 C。 的 特征 向 量 组 成 ,因此 ,K-L 变换 具有 
如 下 人 性质。 
(1) 变换 后 图 像 向 量 Y 的 均值 向 量 为 0(0 向 量 ) , 即 
m, = E[Y] = ELA(X—m,)] = AE[X]— Am, = 0 (3-81) 
(2) 向 量 Y 的 协 方差 矩阵 C, 可 由 A 和 C-。 求 得 ,公式 为 
C,= ELGY 一 my)(Y 一 my)T] = E{[AX 一 hm]LAK 一 Am]7)》 

= EL[A(X—m,)(X—m,)"™A"] 

= AE[(X—m)(X—m)'AT 

= AC,AT (3-82) 


74 者 | 数字 图 像 处 理 及 应 用 一 一 使 用 MATLAB 分 析 与 实现 


(3) 经 过 K-L 变换 后 完全 消除 了 元 素 之 间 的 相关 性 , 即 协 方差 矩阵 C, 是 对 角 和 矩阵 , 且 
主 对 角 线 上 的 元 素 等 于 C; 的 特征 值 , 即 
A 0 


C = 和 (3-83) 


0 AN 
协 方差 矩阵 C, 主 对 角 线 以 外 的 元 素 全 部 为 0, 即 变换 图 像 向 量 Y 的 各 个 元 素 是 互 不 相关 
的 ,由 于 jjG 一 1,2,…,N) 也 是 C 的 特征 值 ,所 以 C, 和 C, 具有 完全 相同 的 特征 值 和 特征 
向 量 。 


3.3.3 K-L 变换 的 逆 变 换 


与 其 他 变换 类 似 ,K-L 变换 也 有 逆 变 换 , 即 可 以 通过 来 重建 X。 由 于 矩阵 4 的 各 行 
都 是 正 交 归 一 化 矢量 ,所 以 有 
4 =AT 
根据 K-L 变换 形式 可 得 
下 一 4 TY 十 mr (3-84) 
由 于 协 方差 矩阵 特征 值 是 由 大 到 小 排列 的 ,在 许多 实际 应 用 中 ,可 以 充分 利用 K-L 变 
换 的 这 个 性 质 进 行 近似 计算 。 例 如 ,可 以 只 取 一 部 分 特征 值 及 其 对 应 的 特征 向 量 , 若 取 前 
个 特征 值 , 则 可 以 表示 为 


站 0 
As 
到 = 已 = 志 
0 
即 可 以 只 取 前 个 分 量 重建 X 的 近似 值 
X, = A7'Y + m, (3-85) 
因此 ,可 以 得 出 XX, 和 XX 之 间 的 均 方 误差 为 
. 
下 过 六 六 (3-86) 


k=ntl 

显然 ,车 == N?, 则 均 方 误差 为 0, 即 可 以 精确 地 重 构 X。 由 于 特征 值 (i 二 1,2,…， 
NN’) 是 单调 递减 的 ,因此 ,可 以 通过 取 不 同 的 值 来 控制 XX, 和 X 之 间 的 均 方 误差 , 即 完全 
可 以 根据 误差 的 要 求 来 控制 所 取 特 征 值 的 数量 。 因 此 ,理论 上 K-L 变换 可 以 将 均 方 误差 控 
制 到 任意 小 的 程度 ,或 者 说 可 以 实现 均 方 误差 最 小 意义 下 的 最 优 变换 。 

综 上 所 述 ,K-L 变换 具有 许多 优点 ,其 最 重要 的 优点 是 去 相关 性 能 非常 好 , 它 可 以 完全 
解除 数据 之 间 的 相关 性 ,因此 ,K-L 变换 可 广泛 用 于 图 像 数据 的 旋转 或 压缩 处 理 。 但 K-L 
变换 也 具有 自身 的 明显 缺点 ,这 就 是 二 维 K-L 变换 不 可 分 离 的 变换 ,不 能 通过 在 zx 与 y 方 


出 
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向 上 的 两 次 一 维 的 K-L 变换 来 完成 二 维 K-L 变换 的 运算 。 同 时 ,K-L 变换 是 一 种 和 图 像 数 
据 有 关 的 变换 ,在 变换 中 ,必须 计算 图 像 数 据 的 N? X N? 协 方差 矩阵 的 特征 值 和 特征 向 量 ， 
计算 量 非常 庞大 ,因而 K-L 变换 在 实际 图 像 处 理 中 并 没有 得 到 所 期 望 的 普及 程度 。 


3.4 离散 沃 尔 什 变换 


DFT 或 DCT 变换 都 是 以 正弦 或 余弦 三 角 函 数 为 基本 的 正 交 函 数 基 ,而 DFT 的 快速 运 
算是 复数 范围 内 进行 运算 ,不 仅 运算 量 庞大 ,而 且 运 算 复 杂 ,DCT 变换 虽然 避免 了 复数 运 
算 , 但 需要 进行 三 角 函 数 运算 ,运算 复杂 程度 依然 很 高 。 因 此 ,无 论 DFT, 还 是 DCT 运算 ， 
占用 时 间 仍 然 较 多 ,而 在 实际 应 用 中 ,有 时 需要 更 为 有 效 和 便利 的 变换 方法 。 沃 尔 什 变换 就 
是 其 中 一 种 , 它 有 效 地 避免 了 因数 据 本 身 原 因 所 产生 的 运算 复杂 性 , 它 由 只 有 十 1 和 一 1 两 
个 数值 所 构成 的 完备 正 交 基 组 成 。 由 于 沃 尔 什 函 数 基 是 二 值 正 交 基 ,与 数字 逻辑 的 两 个 状 
态 相 对 应 ,因而 更 加 适用 于 计算 机 技术 ,数字 信号 处 理 等 应 用 领域 。 

此 外 ,与 DFT 相 比 , 沃 尔 什 变换 减少 了 存储 空间 并 提高 了 运算 速度 ,这 一 点 对 图 像 处 理 
来 说 是 至 关 重 要 的 ,特别 是 在 大 量 数据 需要 进行 实时 处 理 时 , 沃 尔 什 变换 更 加 显示 出 其 优 


3.4.1 一 维 离散 沃 尔 什 变换 

沃 尔 什 (Walsh) 变 换 与 沃 尔 什 函数 密切 相关 , 沃 尔 什 函数 是 1923 年 由 美国 数学 家 沃 尔 
什 首 先 提出 的 。 沃 尔 什 函数 系 是 一 个 完备 正 交 函 数 系 , 其 值 只 能 取 十 1 和 一 1。 从 排列 次 序 
上 可 将 沃 尔 什 函 数 分 为 三 种 定义 方法 : 一 是 按照 佩 利 排列 来 定义 ( 按 自然 排序 ); 二 是 按照 
沃 尔 什 排列 来 定义 ( 按 列 率 排序 ); 三 是 按照 哈达 玛 排列 来 定义 ,又 称 为 哈达 玛 变换 。 

1. 沃 尔 什 正 变换 

设 /(z) 表 示 N 点 的 一 维 离散 序列 , 则 一 维 沃 尔 什 变换 定义 为 


N=-1 el 
1 Do Db 

FO = -一 >) /2 DEY i 0, (u=0,1,2,3,.…,NO—1) (3-87) 
MN z=0 


其 中 ,一 维 沃 尔 什 变换 核 为 
g(z3u) = i D Bh (3-88) 


式 中 ,w=0,1,2,3,…,N 一 1; x 二 0,1,2,3,…,N 一 1。NN 是 沃 尔 什 变换 的 阶 数 ,N 王 2"。 
bi(z) 是 z 的 二 进 制 数 的 第 i 位 数值 , 取 值 为 0 或 1。 如 一 6, 由 于 6 的 二 进 制 表示 为 110, 因 
此 W(x)=0501 0)=150 (2)=1; 

2. 沃 尔 什 逆 变 换 

一 维 离散 沃 尔 什 逆 变换 定义 为 


N=1 sl 

| Do DoD es 

jz) = FO DE , z=0,1,2,3,.,N—1 (3-89) 
VN et 9 


道 变 换 的 核 为 
h(zsu) = g(r,u) 
一 维 沃 尔 什 正 、 反 变换 核 相 同 , 沃 尔 什 变换 核 是 一 个 对 称 阵列 ,其 行 和 列 是 正 交 的 。 沃 
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尔 什 正 ` 反 变换 形式 本 质 上 相同 ,因此 ,计算 沃 尔 什 变换 的 算法 可 直接 用 来 求 其 逆 变 换 。 一 
维 沃 尔 什 变换 也 具有 快速 算法 ,简称 为 FWT, 在 形式 上 和 FFT 算法 类 似 。 当 N= 二 8 时 ,其 
变换 核 用 矩阵 表示 为 


1 1 1 1 1 1 1 LY 

L 1 1 ,st tt 

1 WW 二 1 1 a 二 二 
ps i et Wt 1 E 
起 1 | 和 1 和 1 1 

1 1 1 ll 和 

VV = 1 1 1 = = 

vb =P = = L 和 


3.4.2 二 维 离散 沃 尔 什 变换 


1. 二 维 沃 尔 什 正 变换 
设 F(z,y) 表 示 MXN 的 二 维 离散 序列 , 则 二 维 沃 尔 什 变换 定义 为 


M-1 N-1 
Flusw) = >) >) (zy)g(zayyyo)， (u=0,1,2,3,°,M—1;v=0,1,2,3,.,N—1) 
z=0 y=0 
(3-90) 
其 中 ,二 维 离散 沃 尔 什 变换 核 为 
AN-1 nl nl 
td 1 [6, (x)%, (WI+ D [ex)%, (Co0] 
gzyayyya) 一 一 二 一》) (一 1) 忆 故人 bi 二 到 区 人 5 (3-91) 
VMN = “ 
式 中 ,M=2",N=2"。 
二 维 离散 沃 尔 什 变换 的 变换 核 是 可 分 离 的 , 即 
| ml nl 
a 1 DE [ez)%, (WJ+ 5 [b,x)b, (oO] 
SCzryuyyy ua) 一 一 一 >》)( 一 1) 多 
1 VMN «= be 
1 N=-1 号 1 ee 号 
— DE D0] LS 1) DCD] 
= g(x ug (yy) (3-92) 


根据 沃 尔 什 变换 的 定义 形式 可 以 得 出 ,二 维 沃 尔 什 变换 具有 可 分 离 特性 , 即 一 次 二 维 沃 
尔 什 变换 可 以 通过 两 次 一 维 沃 尔 什 变换 来 实现 。 
2. 二 维 沃 尔 什 逆 变换 


二 维 沃 尔 什 逆 变换 定义 为 
M-1 Nl 
fxs9) = DO FO hrsusys0), r=0,1,2,3,.°,M—1; y=0,1,2,3,.…,N—1 
二 
(3-93) 
二 维 离散 沃 尔 什 逆 变 换 核 为 
MN-2 ml] ol 
1 
加 (Tt yu) 一 = 于 = 1) EO Dd bt (3-94) 
VMN = . 


式 中 ,M 一 2",N 一 2"。 
二 维 沃 尔 什 逆 变 换 的 核 为 
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PCzyatyyyu) = SC yy 0) 


同样 ,二 维 逆 变 换 具 有 可 分 离 性 。 二 维 沃 尔 什 变换 也 可 以 表示 为 矩阵 形式 , 即 


F= i 1fGs 
(3-95) 
f= mr 
VMN 


式 中 ,Gi 为 MXM 变换 核 方 阵 ; Gs 为 NXN 变换 核 方 阵 。 
3.4.3 沃 尔 什 变换 的 频谱 


和 DCT 变换 相同 ,二 维 沃 尔 什 变换 也 具有 能 量 集 中 的 性 质 ,原始 图 像 数据 越 是 均匀 分 

天 尔 什 变 换 后 的 数据 越 集中 于 和 矩阵 的 边 角 上 ,因此 ,二 维 沃 尔 什 变换 也 常用 于 压缩 图 像 
信息 。 

例 3-5: 沃 尔 什 变换 实例 

如 图 3-8 所 示 是 沃 尔 什 变 换 的 实例 ,图 3-8(a) 为 对 应 于 图 3-7(a) 的 沃 尔 什 变换 结果 ， 
图 3-8(b) 为 对 应 于 图 3-7(c) 的 沃 尔 什 变换 结果 


(a) 原始 图 像 的 沃 尔 什 变换 (b) 旋转 45° 沃 尔 什 变换 
图 3-8 沃 尔 什 变换 的 频谱 分 布 
沃 尔 什 变换 是 将 一 个 函数 变换 成 取 值 为 十 1 或 一 1 的 基本 函数 构成 的 级 数 , 用 它 来 通 近 
数字 脉冲 信号 时 要 比 DFT 有 利 。 因 此 , 它 在 图 像 传输 .通信 技术 和 数据 压缩 中 获得 了 广泛 
的 使 用 。 同 时 , 沃 尔 什 变换 是 实数 ,所 以 对 工程 应 用 问题 , 沃 尔 什 变换 的 存储 量 比 DFT 少 ， 


而 且 运 算 速度 非常 快 。 

例 3-6: 有 两 个 二 维 数字 图 像 信号 , 即 

和 和 

i = Wy 

和 

by 喜 盐 唱 | 

[本 和 名 和 0 

= 六 过 中 

名 党 光 

I 于 半生 入 


分 别 求 i 和 fs 的 二 维 沃 尔 什 变换 。 
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离散 二 维 沃 尔 什 变换 的 求解 过 程 如 下 : 
根据 理论 ,对 于 (1) 和 (2), 均 有 MM 二 N= 二 4, 因 此 ,其 二 维 沃 尔 什 变 换 的 核 为 
1 和 


= 
i 
二 
由 此 可 得 
和 生生 交 商 下 二 ii 
jl 二 天， 齐 = 丰年 家 天 和 二 和 区 和 
Fu) 王 二 x x 
£5 | 0 | i LL 全 ,二 者 二 者 
二 让 己 赴 守 二 = 二 = 六 
i do 
| 
| 
人 
业 二 和 下 证 
1|1 -1 1 -1 1 VV = 他 。 曾 寺 询 
Fz(z) 一 二 > 
可 | 六 二 三 下 三 于 | | 本 
1 -1 —1 1 jE 二 二 
2 = 
Iwo a 
“| 
000 0 


3.5 离散 哈达 玛 变 换 


哈达 玛 (Hadamard) 变 换 与 沃 尔 什 变换 十 分 类 似 , 就 其 本 质 而 言 , 哈 达 玛 变换 是 一 种 特 
丈 排序 的 沃 尔 什 变换 。 因 此 ,有 的 书 上 称 为 沃 尔 什 -哈达 玛 变换 。 哈 达 玛 变换 矩阵 也 是 一 
个 仅 包括 十 1 和 一 1 两 个 矩阵 元 素 的 方 阵 , 任 意 两 行 或 两 列 相 乘 后 的 各 数 之 和 必定 为 零 , 即 
不 同 的 行 或 不 同 的 列 之 间 都 彼此 正 交 , 哈 达 玛 变换 核 矩 阵 与 沃 尔 什 变换 不 同 之 处 仅仅 是 行 
的 次 序 不 同 。 哈 达 玛 变换 的 最 大 优点 在 于 它 的 变换 核 矩 阵 具 有 简单 的 递 推 关 系 , 即 高 阶 矩 
阵 可 以 通过 低 阶 矩阵 求 出 。 因 此 ,许多 人 基于 这 个 特点 更 愿意 应 用 哈达 玛 变换 。 


3.5.1 一 维 离散 哈达 玛 变换 


1. 一 维 哈 达 玛 正 变换 
设 /(z) 表 示 N 点 的 一 维 离散 序列 , 则 一 维 哈达 玛 变换 定义 为 
3 N=-1 


= 
房 


z=0 人 N z=0 


C3-96) 
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其 中 ,g(Czyz) 是 一 维 哈达 玛 变换 的 核 ,定义 为 
5 
(za = 一 (一 1) 忆 4220 (3-97) 
EA VN i=0 
式 中 ,=0,1,2,3,… ,NN 一 1; z= 二 0,1,2,3,…,N 一 1。N 是 哈达 玛 变 换 的 阶 数 , N= 二 2"。 
bi(z) 是 = 的 二 进 制 数 的 第 i 位 数值 , 取 值 为 0 或 1。 
2. 一 维 哈达 玛 逆 变换 
若 已 知 N 点 的 一 维 离 散 序列 下 (ww) , 则 可 以 进行 哈达 玛 逆 变 换 , 其 定义 为 
F(z) = SPFodhceww EE, 直 2r@C Dh, r=0,1,2,3,N— 1) 
(3-98) 
与 正 变 换 相同 ,h(x,w) 是 一 维 哈达 玛 逆 变 换 的 核 , 道 变换 核 与 正 变换 核 相 等 , 即 
= -局 和 1) Bum (3-99) 
哈达 玛 变 换 的 阶 数 具 有 规律 性 , 即 按照 N= 二 2" 规律 递 升 ,高 阶 哈 达 玛 矩阵 可 以 通过 低 
阶 哈 达 玛 矩阵 的 克 罗 尼 科 积 运算 求 得 。 为 了 表示 方便 ,一 般 将 哈达 玛 变换 系数 | -7 ] 作 为 


VN 
前 置 系数 ,不 同 阶 的 哈达 玛 矩阵 具有 如 下 关系 : 
(1) Hl=[1] 


1 1 
(2) H,= 
| 二 更 


人 
ws 
$F 
= 
Hy Hy 
采用 上 述 规律 求 哈达 玛 变 换 矩 阵 要 比 直接 用 哈达 玛 变 换 核 求 矩 阵 快 得 多 ,此 结论 提供 
了 一 种 快速 哈达 玛 变换 ,也 可 称 为 FHT。 例 如 ,根据 哈达 玛 和 矩阵 的 运算 规律 ,可 以 得 出 8 阶 
哈达 玛 和 矩阵 为 


(4) Hn=H» 一 再 :GO -| 
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还 有 一 种 常用 的 哈达 玛 变换 称 为 定 序 了 哈达 玛 变换 , 定 序 的 哈达 玛 变换 是 由 前 面 介 绍 的 
哈达 玛 变换 演变 而 来 。 在 哈达 玛 变换 矩阵 中 ,通常 将 某 一 列 元 素 符 号 改变 的 总 次 数 称 为 这 
个 列 的 列 率 。 则 前 面 给 出 的 N= 二 8 时 的 变换 矩阵 Hs 的 8 个 列 的 列 率 分 别 为 0、7、3、4、1、6、 
2.5。 而 下 面 要 介绍 的 定 序 哈达 玛 变换 的 变换 矩阵 的 列 率 是 随 x 的 增加 而 递增 的 。 例 如 
N=8 时 , 定 序 哈 达 玛 变换 矩阵 的 列 率 从 第 1 列 到 第 8 列 分 别 为 0、1、2、3、4、5、6、7。 

当 N= 二 2" 时 , 定 序 哈 达 玛 正 变换 核 和 逆 变 换 核 相同 ,其 变换 核 为 


na 
gr) = hzs0) = HD Eh (3-100) 


pi(u) 按 以 下 递 推 关系 求 得 
po lu) = bi(u) 
Pi(u) = bai(u) tt bes (u) 
ps(u) = bz (u) ths (u) 


pri (1) = bi (1) + bo lu) 
因此 , 定 序 的 哈达 玛 正 反 变换 对 为 


N- N-1 rl 
. 1 
F(W) = >) F(z)g(za) = rs D Dun (3-101) 
A-1 1 N=-1 ml 
fz) = PD FONDA ) = FC DE Dn (3-102) 
u=0 ~ N u=0 


例 3-7: 根据 定 序 的 哈达 玛 变 换 核 , 求 8 阶 哈达 玛 变换 矩阵 。 
由 于 定 序 哈达 玛 变换 的 列 率 是 递增 规律 ,因此 ,8 阶 哈 达 玛 变换 矩阵 为 
1: 


1 1 1 0 ed 

1 = = = 1 1 
六 i 一 
j 娩 | 证 -三 引 三 4 1 和 1 
二 和 = 1 | 

1 1 1 1 1 L 1 1 

1 1 和 . 1 1 


3.5.2 二 维 离散 哈达 玛 变换 
一 维 哈达 玛 变换 可 以 很 方便 地 推广 到 二 维 , 其 正 变换 定义 为 


MI AN=1 
Fl = DD fr Wer yd) 

2 

M-1 N=-1 
二 7Czsy) (一 D Eom, (可 (3-103) 
:二 
道 变换 为 
M-1 N=-1 


zy 一 DD FO Dh yd) 


w=0 v=0 
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Ml N= ml wl 
一 党 DF v0)(— 1) Dnt Db) (3-104) 
MN a 
二 维 哈 达 玛 正 变换 的 核 为 
Tc SRD one (3-105) 
: VMN «=0 o=0 加 Pe 


a = 
二 维 哈达 玛 逆 变 换 核 与 正 变换 核 相 等 , 即 
ACTZyuyyu) = SC yyD) (3-106) 

二 维 哈达 玛 变换 核 是 可 分 离 和 对 称 的 ,因此 一 次 二 维 哈达 玛 变换 也 可 分 为 两 次 一 维 哈 
达 玛 变换 的 计算 而 实现 。 二 维 哈达 玛 变换 也 有 相应 的 定 序 的 哈达 玛 变 换 , 与 一 维 情况 类 似 ， 
只 需 将 二 维 正 反 变 换 定义 中 的 bi (ww) 或 5:(v) 改 为 对 应 的 pi(t) 或 p;(v) 即 可 。 

根据 运算 原理 ,哈达 玛 变 换 和 矩阵 具有 简单 的 递 推 关系 , 且 正 \ 反 变换 和 矩阵 完全 相同 ,只 包 
含 实 数 的 加 、 减 法 运算 而 没有 复数 的 乘法 运算 ,使 得 计算 速度 快 、 存 储 空间 少 ,有 利于 硬件 实 
现 ,对 实时 处 理 和 大 量 数据 操作 具有 特殊 吸引 力 ,因此 获得 了 广泛 的 应 用 。 如 通信 和 领域 中 的 
多 路 数字 通信 系统 .语音 加 密 、 视 频 编码 系统 、 雷 达 系 统 、 图 像 通信 系统 ; 在 信号 处 理 领 域 中 
的 信号 分 析 与 综合 .功率 谱 分析 、 模 式 识别 .图 像 处 理 。 特 别 是 在 图 像 传输 ,存储 系统 中 ,用 
于 图 像 压 缩 非 党 有效。 该 变换 虽然 具有 上 述 许多 优点 ,但 与 建立 在 正弦 本 数 基础 上 的 傅 里 
叶 变换 相 比 ,哈达 玛 变换 在 理论 上 和 实践 上 还 有 一 些 问题 需要 进一步 的 研究 。 如 相关 与 卷 
积 的 运算 ,如 何 从 经 济 上 和 技术 上 解决 以 矩形 波 为 基础 的 设备 ,来 取代 现 有 以 正弦 波 为 基础 
的 大 量 设备 等 问题 。 


3.6 小 波 变换 


小 波 变换 近年 来 在 图 像 处 理 中 受到 了 前 所 未 有 的 重视 ,面向 图 像 压 缩 .特征 检测 以 及 纹 
理 分 析 的 许多 新 方法 ,如 多 分 辨 率 分 析 、 时 频 域 分 析 、 金 字 塔 算法 等 ,都 可 以 归于 小 波 变换 
(wavelet transforms) 的 范畴 。 与 傅 里 叶 变 换 相 比 , 小 波 变换 由 于 其 在 高 频 时 具有 的 时 间 精 
度 和 低频 时 所 具有 的 频率 精度 ,能 自动 适应 时 频 信号 分 析 的 要 求 , 可 以 聚焦 到 信号 的 任意 细 
节 等 显著 特点 而 得 到 了 越 来 越 广泛 的 研究 和 重视 ,小 波 变 换 被 迅速 应 用 到 图 像 和 语音 分 析 
等 众多 领域 。 近 十 年 来 ,对 小 波 变换 理论 研究 已 成 为 应 用 数学 和 信和 号 处 理 领 域 的 一 个 新 
方向 。 


3.6.1 小 波 变换 简介 


小 波 变换 是 法 国 从 事 地 质 勘探 工作 的 信号 处 理工 程 师 ]. Morlet 于 1974 年 首先 提出 
的 。Morlet 根据 物理 及 信号 处 理 的 应 用 需求 提出 了 推演 公式 ,但 在 当时 的 条 件 下 ,如 同 欧 
拉 提 出 任 一 函数 都 能 展开 成 三 角 函 数 的 无 穷 级 数 一 样 ,未 能 得 到 著名 数学 家 Lagrange、 
Laplace 等 的 认可 。 

实际 上 ,在 20 世纪 70 年 代 , 著 名 科学 家 A. Calderon 表示 定理 的 发 现 以 及 Hardy 空间 
的 原子 分 解 和 无 条 件 基 的 深入 研究 为 小 波 变换 的 诞生 做 了 理论 上 的 准备 ,著名 数学 家 
Y. Meyer 于 1986 年 第 一 次 构造 出 一 个 真正 的 小 波 基 , 并 与 S. Mallat 合作 建立 了 构造 小 波 
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基 的 方法 及 多 尺度 分 析 法 ,随后 ,小 波 变换 开始 受到 广泛 的 重视 。 其 中 ,比利时 女 数学 家 
I. Daubechies 撰 写 的 Ten Lectures on Wavelets 对 小 波 的 普及 起 了 重要 的 推动 作 
与 传 里 叶 变 换 、 加 伯 变 换 ( 加 窗 侍 里 叶 变 换 ) 相 比 ,小 波 变 换 又 被 称 为 “ 数学 显微镜 ", 是 
一 个 时 间 和 频率 的 局 域 变换 ,因而 能 有 效 地 从 信号 中 提取 信息 ,通过 伸缩 和 平移 等 运算 对 信 
号 进行 多 尺度 细 化 分 析 , 有 效 解决 了 傅 里 叶 变 换 面 临 的 许多 问题 ,成 为 继 傅 里 叶 变换 以 来 在 

科学 方法 上 的 重大 突破 之 一 。 

小 波 变 换 具有 广泛 的 适应 性 ,特别 是 对 非 平稳 随机 信号 ,小 波 变 换 同样 可 以 适应 。 作 为 
一 种 数学 分 析 工 具 ,小 波 变 换 可 以 用 于 许多 学 科 , 如 信号 分 析 、 量 子 力学 、 理 论 物理 数值 分 
析 、 曲 线 曲 面 构 造 、 微 分 方程 求解 、 控 制 论 、 军 事 电 子 对 抗 、 军 械 装备 智能 化 等 ; 小 波 分 析 在 
信号 处 理 中 的 应 用 也 十 分 广泛 , 它 可 以 用 于 信号 处 理 的 各 方面 ,如 信号 滤波 、 时 频 分 析 、 信 噪 
分 离 、. 弱 信号 提取 、 求 分 形 指数 、 信 号 识别 与 诊断 和 多 尺度 边缘 检测 等 。 小 波 分 析 还 可 用 于 
图 像 滤 波 .去 噪声 .图 像 压 缩 等 很 多 方面 ,基于 小 波 的 图 像 压 缩 算法 不 仅 压 缩 比 高 .速度 快 ， 
而 且 压 缩 后 能 保持 信号 与 图 像 的 特征 不 变 , 在 传输 中 具有 一 定 的 抗 干扰 性 。 


3.6.2 连续 小 波 变换 


傅 里 叶 变 换 是 以 两 端 无 限 延伸 的 正弦 波 作 为 基 枯 数 的 ,其 重要 特点 是 可 以 展现 信号 的 
频 域 特征 ,但 却 基 本 消失 了 信号 的 时 间 局 部 化 信息 。 为 了 克服 傅 里 叶 变换 的 不 足 , 人 们 提出 
了 小 波 变换 。 小 波 变换 的 基 函 数 在 频率 上 和 位 置 上 都 是 变化 的 ,是 有 限 宽度 的 波 , 称 为 小 波 
(wavelet) ,基于 它们 的 变换 就 是 小 波 变换 。 小 波 变 换 能 同时 刻画 信号 时 频 两 域 的 特性 , 它 
通过 放 缩 母 小 波 来 获得 信号 的 频率 信息 ,通过 平移 母 小 波 来 获得 信号 的 时 间 信息 。 对 小 波 
的 放 缩 和 平移 是 计算 小 波 系 数 的 需要 ,小波 系 数 反映 了 小 波 和 局 部 信号 之 间 的 相关 特性 。 

1. 一 维 连续 小 波 变换 

设 函 数 /Co 具 有 有 限 能 量 , 即 1/(4) EL?(R), 则 连续 小 波 变换 (CWT) 的 定义 为 


es 
Wi(asD)=< 太 加 sz) 之 一 上 f Dyas Dd 


= 上 [po 4 与 2); a OD E LCRY (3-107) 
Va -oo a 


式 中 ,a 为 尺度 因子 ; 6 为 位 移 因子 ; 丽 数 秋 s(0) 称 为 小 波 。 
连续 小 让 变换 也 称 为 积分 小 让 变换 ,积分 核 为 如 sD 一 十 | 站 气 ]dt 的 两 数 族 。 


若 wo 二 1 函数 y(1) 具 有 伸展 作用 ,车 a 二 1 函数 y(1) 具 有 收缩 作用 。 随 着 a 的 减 小 ,ys (w) 
的 支撑 区 间 也 随 之 变 罕 ,而 y,,(w) 的 频谱 随 之 向 高 频 展 宽 , 反 之 亦 然 。 因 此 ,小 波 变换 可 以 
实现 窗口 大 小 的 自 适应 变化 。 当 信和 号 频率 升 高 时 ,时 窗 宽度 变 罕 ,而 频 窗 宽度 则 增 大 ,从 而 
有 利于 提高 时 域 分 辨 力 ; 当 信号 频率 降低 时 ,时 窗 宽度 增 大 ,而 频 窗 宽度 则 变 窄 , 提 高 频率 
分 辨 力 。 

2. 小 波 的 选择 

小 波 y(1) 的 选择 不 是 唯一 的 ,但 也 不 是 任意 的 ,y(1) 是 具有 归 一 化 .具有 单位 能 量 的 解 
析 函 数 , 所 有 小 波 是 通过 对 基本 小 波 进行 尺度 伸缩 和 位 移 得 到 的 。 

(1) 基本 小 波 是 一 具有 特殊 性 质 的 函数 , 它 是 振荡 衰减 的 ,而 且 通 常 衰减 得 很 快 ,在 数 
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学 上 满足 积分 为 零 的 条 件 : 
[ya =0 (3-108) 


因此 ,基本 小 波 是 一 个 积分 为 零 且 能 量 集中 在 以 :一 0 为 中 心 的 邻 域内 ,而 且 小 波 函数 
还 具有 速 降 性 和 紧 支 性 。 其 高 阶 矩 也 为 0, 即 


[wood =0, k=0,1,2,3,.,N—1 (3-109) 
该 条 件 称 为 小 波 的 容许 条 件 : 
6G; = 三 To) du 一 co (3-110) 
一 co ww 


由 于 Wo) = 六 woerd， Ci<co, 因 此 ,yw) 连 续 可 积 , 即 


ws 
4%(0) = 人 yD dt=0 (atly 


根据 式 (3-111) 可 以 得 出 ,小 波 y(w) 在 1 轴 上 具有 正 负 取 值 才 可 能 满足 上 式 的 积分 为 
0, 因 此 ,yw) 应 具有 振荡 性 。 

(2) 小 波 %2) 的 定义 域 是 紧 支 撑 的 , 即 在 一 个 很 小 的 区 间 之 外 ,小 波 %(z) 迅 速 衰减 为 
0, 也 就 是 说 小 波 函 数 %2) 具 有 速 降 性 。 

综 上 所 述 ,小 波 y(1) 是 一 种 具有 振荡 性 的 且 迅 速 衰减 的 波 。 

3. 小 波 变换 的 逆 变 换 

对 于 所 有 的 /oO) ,WOEEL:CR), 则 连续 小 波 变换 的 逆 变 换 定义 为 


ne 
/0 = 二 | 站 aW/(a,b) gus (tdadb (3-112) 


Gy 
4. 二 维 连 续 小 波 变 换 
二 维 小 波 变 换 也 分 为 二 维 连 续 小 波 变 换 和 二 维 离 散 小 波 变换 。 
(1) 二 维 连续 小 波 变 换 为 


十 co [十 co 
Wi/(a,b sb,) = 上 上 f xo) nt, Try) drdy ek 
式 中 ,加 ww (zyy) 为 二 维 连续 小 波 基 函 数 , 即 
gasses, (zy) 一 | (3-114) 
(2) 二 维 小 波 变 换 的 逆 变 换 为 
二 ew Ce Ces yd db bda (T1585 
= Wb sb gs, C13) doedb, 


二 维 连续 小 波 的 允许 条 件 如 下 : 
(1) 定义 域 为 紧 支 撑 集 。 
(2) 均值 为 0, 即 


六 六 wmpardy 兰 生 


5. 几 种 典型 的 小 波 
小 波 WO 的 选择 是 非常 灵活 的 , 凡 满 足 条 件 的 函数 均 可 以 作为 小 波 函 数 , 其 中 Haar 小 
波 、Mexico Hat 小 波 和 Morlet 小 波 是 常用 的 小 波 函 数 。 


84 本 | 数字 图 像 处 理 及 应 用 一 一 使 用 MATLAB 分 析 与 实现 


1) Haar 小 波 


Haar 小 波 函 数 为 
1 0<i< 广 
= 和 cixi Cady 
， 去 万 
0， 其 他 
该 正 交 函数 是 Haar 于 1990 年 提出 的 函数 ,对 1 平移 可 得 到 
站 wowsc 0 (3-117) 


Haar 函数 波形 如 图 3-9 所 示 。 
LA 


图 3-9 Haar 小 波 波形 
如 图 3-10 所 示 为 两 个 小 波 办 ,CO 和 yg,1(0) 的 波形 。 


图 3-10 ”两 个 Haar 小 波 
该 基本 小 波 定义 的 小 波 变换 称 为 Haar 小 波 变 换 , 是 各 种 常用 的 小 波 变 换 中 最 简单 的 
一 种 变换 形式 。 
2) Mexico Hat 小 波 
Mexico Hat 小 波 是 Gauss 函数 的 二 阶 导 数 , 其 函数 形式 为 


yD) = (3-118) 
5 


Mexico Hat 小 波 也 称 为 Marr 小 波 , Mexico Hat 小 波 是 实数 函数 小 波 , 它 的 更 一 般 形 
式 由 Gauss 函数 的 阶 导数 定义 , 即 
= 1 守 (o) (3-119) 


相应 的 谱 为 
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bw) = njw)"e (C31203 
Mexico Hat 小 波 的 波形 如 图 3-11 所 示 。 


br 六 0 2 4 6 
图 3-11 Mexico Hat 小 波 的 波形 


3) Morlet 小 波 
Morlet 小 波 是 最 常用 的 复数 值 小 波 函 数 ,其 形式 为 


BD =—w ee (3-121) 
6. 小 波 变换 的 性 质 
小 波 变换 常用 的 重要 特性 如 下 : 
(1) 小 波 变 换 是 一 个 满足 能 量 守恒 方程 的 线性 运算 , 它 将 信号 分 解 成 对 空间 和 尺度 ( 即 
时 间 和 频率 ) 的 独立 贡献 ,同时 又 不 失 原 信 号 所 包含 的 信息 。 
(2) 小 波 变 换 不 一 定 要 求 是 正 交 的 ,小 波 基 不 唯一 。 小 波 函 数 系 的 时 宽 -带宽 积 很 小 ， 
且 在 时 间 和 频率 轴 上 都 很 集中 , 即 展 开 系数 的 能 量 很 集中 。 
(3) 小 波 变换 相当 于 一 个 具有 放大 、 缩 小 和 平移 等 功能 的 数学 显微镜 ,通过 检查 不 同 放 
大 倍数 下 信和 号 的 变化 来 研究 信号 的 动态 特性 。 
(4) 小 波 变换 巧妙 地 利用 了 非 均匀 的 分 辩 率 , 较 好 地 解决 了 时 间 和 频率 分 辩 率 的 矛盾 
在 低频 段 用 高 的 频率 分 辨 率 和 低 的 时 间 分 辩 率 ( 宽 的 分 析 窗 口 ) ,而 在 高 频段 则 用 低 的 频率 
分 辩 率 和 高 的 时 间 分 辨 率 ( 窄 的 分 析 窗 口 ) ,这 与 时 变 信号 的 特征 一 致 
(5) 小 波 变换 将 信号 分 解 为 在 对 数 坐标 中 具有 相同 大 小 频带 的 集合 ,这 种 以 非 线性 的 
对 数 方法 而 不 是 以 线性 方法 处 理 频率 的 方法 对 时 变 信号 具有 明显 的 优越 性 。 
(6) 小 波 变换 是 稳定 的 ,是 信号 的 完 余 表示 。 由 于 是 连续 变化 的 , 相 邻 分 析 窗 的 绝 
大 部 分 是 相互 重 琶 的 ,相关 性 很 强 。 
(7) 小 波 变换 与 傅 里 叶 变 换 一 样 ,具有 统一 性 和 相似 性 ,其 正 反 变换 具有 完美 的 对 称 
性 ,小 波 变换 具有 基于 卷 积 和 QMEF 的 塔 形 快速 算法 。 
小 波 变换 具有 许多 重要 而 又 有 应 用 价值 的 性 质 , 其 中 线性 特性 .平移 和 伸缩 特性 、 微 分 
运算 特性 等 三 个 常用 性 质 如 下 : 
1) 线性 特性 
设 及 (0) 的 小 波 变 换 为 Wj (a.5),f2(7) 的 小 波 变 换 为 Wj, Ca:o) :对 于 小 波 变换 则 有 如 
下 线性 关系 。 若 f(2) = 二 ki(2) 十 kf;(1), 则 有 
Wi(asb) = khW (a.b) + haW, (a.b) (3-122) 


86 者 | 数字 图 像 处 理 及 应 用 一 一 使 用 MATLAB 分 析 与 实现 


2) 平移 和 伸缩 特性 
设 /(7) 的 小 波 变 换 为 Wj(a,5), 即 


f(DOW ab) 
则 有 
(1) 平移 特性 : 
f(t—b SOW,(a,b— bo) (9-122) 
(2) 伸缩 特性 : 
f(aod)S lL Wi(aoa,aob) (3-124) 
ao 


3) 微分 运算 特性 
设 /(7) 的 小 波 变 换 为 Wj(a,6), 则 有 如 下 微分 性 质 : 


CR) es Ne 
w,, ( 全 j= co) (0 (3-125) 


3.6.3 离散 小 波 变换 


1. 一 维 离散 小 波 变 换 
连续 小 波 变换 通常 用 于 理论 分 析 ,在 离散 的 数值 计算 中 ,需要 对 小 波 变换 的 尺度 因子 、 


位 移 因子 进行 离散 化 。 
即 取 a 一 ay8 ,6 二 nboa? ,m,n 为 整数 ,ao 二 0,b 二 0, 通 常 取 ao 一 2, 则 一 维 离散 小 波 定 
义 为 
Yn (0) Ly | ariy(as™t — nbo) (3-126) 


由 此 可 得 一 维 离散 小 波 变 换 (DWT) 为 
< fib >= art| /0 = art| /0 gari—mo)dt (3-127) 
2. 二 维 离散 小 波 变换 
一 维 离散 小 波 变换 可 以 扩展 到 二 维 , 这 里 仅 考 虑 尺度 函数 是 可 分 离 的 ,在 二 维 情况 下 ， 
需要 一 个 二 维 可 分 离 的 尺度 函数 g(xz,y) 和 三 个 可 分 离 的 方向 敏感 的 二 维 小 波 (x,y)、 
坟 (z,y) 和 好 (zx,y)。 分 别 是 一 维 尺度 函数 p 和 风 相 应 的 小 波 函 数 的 乘积 , 即 


gpCzyy) 一 PCZ)P(Cy) (3-128) 

$b zy) = $x)9(y) (3-129) 

(zsy) = G(r)$(y) (3-130) 

内 (zsy) = Br) $y) (3-131) 

先 分 别 给 定 可 分 离 的 二 维 尺度 函数 及 二 维 小 波 函 数 ,定义 尺度 基 函 数 和 平移 基 函 数 为 

Pima (Ty) 一 Wp my (3=1S3 站 

Bma(Tsy) = DB (2Diz—m,2y—n) i=1,2,3 (3-133) 

式 中 ,i,j ,m,n 均 为 正 整数 ,由 此 可 得 大 小 为 MXN 的 函数 f(z,y) 的 二 维 离散 小 波 变换 为 
M-1I N-l 

W,(jom,n) = lL 2) 2 fzsy) gma rsy) (3-134) 


VMN z=0 y=0 


出 
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M-1 N-1 


日 a 
DD fs ma(rsy) t= 15233 (3-135) 
NN 0 y=0 


式 中 ,jo 是 任意 的 初始 尺度 ,系数 到 , (jo ,m,n) 定 义 了 在 尺度 训 的 f(x,y) 的 近似 值 ,系数 
TW jom;7D) 对 j 宇 jo ,附加 了 三 个 方向 的 细节 。 一 般 情况 令 j 宇 jo,M==N=27 ==0,1,2,3,…， 
J 一 1 和 m,n 二 0,1,2,3,"…,2i 一 1)。 

二 维 离散 小 波 逆 变换 为 


f(r,y) = 


Wi(jom,n) = 


i PS Wo jo mm pm 


认 
市 EE EW om pny) (3-136) 


习题 


. 什么 是 数字 图 像 的 变换 域 处 理 方法 ? 它 的 基本 思路 是 什么 ? 
. 根据 傅 里 叶 变 换 的 定义 , 傅 里 叶 变 换 存 在 的 条 件 有 哪些 ? 
.什么 是 高 斯 函数 ?高 斯 函数 的 傅 里 叶 变 换 具有 哪些 特点 ? 
.什么 是 功率 谱 ? 功率 谱 的 物理 意义 是 什么 ? 
. 试 述 什么 是 傅 里 叶 变 换 的 旋转 不 变性 和 可 分 离 性 。 

6. 选择 一 幅 图 像 ,编写 MATLAB 程序 实现 以 下 功能 : 

(1) 实现 图 像 的 二 维 傅 里 叶 变 换 , 绘 出 幅 值 谱 和 相位 谱 图 像 。 

(2) 结合 理论 分 析 , 观 察 傅 里 叶 变 换 的 频谱 分 布 特点 。 

(3) 进行 傅 里 叶 逆 变 换 重 建 图 像 。 

(4) 假定 相位 等 于 0, 依据 幅 值 谱 重 构图 像 。 

(5) 假定 幅 值 等 于 常数 ,依据 相位 谱 重 构图 像 。 

(6) 总 结 图 像 傅 里 叶 变 换 的 特点 。 

7. DCT 变换 的 主要 优点 有 哪些 ? 

8. 编写 MATLAB 程序 对 一 幅 图 像 进行 DCT 变换 ,分 析 其 频谱 分 布 特点 。 

9. 什么 是 K-L 变换 ? 为 什么 说 K-L 变换 是 最 佳 变换 ? 

10.K-L 变换 消除 图 像 数 据 相 关 性 的 原理 是 什么 ? 

11， 简 述 K-L 变换 如 何 控制 重 构图 像 的 误差 。 

12. 什么 是 沃 尔 什 变换 ? 沃 尔 什 变换 具有 哪些 主要 特点 ? 

13. 什么 是 哈达 玛 变换 ? 它 与 沃 尔 什 变换 有 何 区 别 和 联系 ? 

14. 不 同 阶 数 的 哈达 玛 变换 矩阵 有 何 关系 ? 

15. 什么 是 小 波 ? 小 波 具有 哪些 特性 ? 

16. 试 简 述 小 波 变换 的 主要 特点 。 

17. 简要 说 明 由 连续 小 波 变 换 推 出 离散 小 波 变换 时 ,如 何 对 一 维 小 波 变换 的 尺度 因子 、 
位 移 因 子 进 行 离散 化 。 

18. 应 用 MATLAB 对 一 幅 图 像 进行 小 波 变换 ,分 析 和 总 结 图 像 小 波 变换 的 特点 。 


an 和 性 


4 图 像 处 理 的 基本 运算 


CHAPTER 4 


图 像 处 理 是 建立 在 各 种 算法 基础 上 的 处 理 方法 ,这 些 算法 无 论 简单 还 是 复杂 ,常常 涉及 
图 像 像素 的 灰 度 值 运算 和 几何 位 置 关系 运算 。 基 于 像素 的 灰 度 值 以 及 几何 位 置 关 系 运 算 都 
属于 图 像 处 理 中 的 基本 和 运算。 本章 将 围绕 数字 图 像 处 理 的 基本 运算 ,主要 介绍 图 像 处 理 中 
的 点 和 运算、 代数 运算 和 几何 变换 ( 齐 次 坐标 体系 ` 图 像 平移 .旋转 变换 .比例 缩放 \ 镜 像 变换 、 
图 像 复 合 变换 和 透视 变换 等 ) 及 其 在 图 像 处 理 中 的 应 用 等 。 


4.1 基本 运算 的 类 型 


在 数字 图 像 处 理 中 ,经常 需要 采用 各 种 各 样 的 算法 。 根 据 数字 图 像 处 理 运算 中 输入 信 
息 与 输出 信息 的 类 型 ,具有 代表 性 的 图 像 处 理 典型 算法 从 功能 上 包括 以 下 几 种 : 

(1) 单 幅 图 像 一 ~ 单 幅 图 像 。 

(2) 多 幅 图 像 一 ~ 单 幅 图 像 。 

(3) 单 幅 或 多 幅 图 像 一 ~ 数值 /符号 等 。 

在 以 上 三 类 运算 形式 中 ,所 有 输入 信息 都 是 图 像 且 其 灰 度 值 都 是 非 负 整 数值 ,而 输出 信 
息 的 形式 则 各 不 相同 , 既 可 以 是 具有 非 负 灰 度 值 的 数字 图 像 , 又 可 以 是 仅 具有 0、1 两 个 灰 度 
值 的 二 值 图 像 ,也 可 以 是 对 输入 图 像 逐 个 像素 点 进行 解释 的 符号 或 由 特定 参数 组 成 的 某 种 
二 维 信息 (又 称 为 标号 图 像 ) ,还 可 以 是 从 图 像 中 提取 出 的 以 数值 或 符号 描述 的 特征 信息 。 
所 有 以 二 维 信息 形式 输出 的 信息 统称 为 广义 图 像 , 标 号 图 像 也 属于 广义 图 像 的 范畴 。 

三 类 运算 中 ,第 一 类 运算 功能 是 数字 图 像 处 理 技术 中 最 基本 的 功能 。 对 基本 的 图 像 处 
理 功 能 ,根据 输入 图 像 得 到 输出 图 像 (目标 图 像 ) 处 理 运算 的 数学 特征 ,可 将 图 像 处 理 运算 方 
式 分 为 点 运算 .代数 运算 和 几何 和 运算。 这 些 运算 都 是 基于 空间 域 的 图 像 处理 运 算 ,与 空间 域 
运算 相对 应 的 是 变换 域 运算 ,将 在 后 续 章 节 中 讨论 。 


4.2 点 运算 
在 图 像 处 理 中 ,点 运算 (point operation) 是 一 类 简单 却 非 常 具有 代表 性 的 重要 算法 之 


一 ,也 是 其 他 图 像 处 理 运算 的 基础 。 运 用 点 运算 可 以 改变 图 像 数 据 所 占据 的 灰 度 值 范围 。 
对 于 一 幅 输入 图 像 ,经 过 点 运算 会 产生 一 幅 输 出 图 像 ,输出 图 像 中 每 个 像素 点 的 灰 度 值 仅 由 
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相应 输入 像素 点 的 灰 度 值 确定 。 这 与 邻 域 处 理 算 法 截然 不 同 ,在 邻 域 算法 中 ,每 个 输出 像素 的 
灰 度 值 由 对 应 输入 像素 的 一 个 邻 域内 若干 像素 点 的 灰 度 值 共同 决定 。 因 此 ,点 运算 不 会 改变 
图 像 内 的 空间 位 置 关 系 。 点 运算 是 图 像 数字 化 软件 以 及 图 像 显 示 软 件 的 重要 组 成 部 分 。 


4.2.1 点 运算 的 种 类 


点 运算 从 数学 上 可 以 分 为 线性 点 运算 和 非 线性 点 运算 两 类 。 

1. 线性 点 运算 

线性 点 运算 指 输入 图 像 的 灰 度 级 与 目标 图 像 的 灰 度 级 呈 线 性 关系 。 线 性 点 运算 的 灰 度 
变换 函数 形式 可 以 采用 线性 方程 描述 , 即 

Ds = aDa+b (4-1) 

式 中 ,D4 为 输入 点 的 灰 度 值 ;， Ds 为 相应 输出 点 的 灰 度 值 。 显 然 , 这 种 线性 运算 关系 可 
图 4-1 表示 。 

(1) 如 果 a 二 1,6 二 0, 则 只 需 将 输入 图 像 复 制 到 输出 图 像 即 可 。 若 a 二 1, 而 5 隆 0, 则 操 
作 仅 使 所 有 像素 的 灰 度 值 上 移 或 下 移 ,其 效果 是 使 整个 图 像 在 显示 时 更 暗 或 更 亮 。 

(2) 如 果 a 二 1, 则 输出 图 像 的 对 比 度 增 大 。 

(3) 如 果 a 二 1, 则 输出 图 像 的 对 比 度 减 小 。 

(4) 如 果 a 二 0, 即 a 为 负 值 , 则 暗 区 域 变 亮 , 亮 区 域 变 暗 ,点 运算 完成 图 像 求 补 。 


255 
Dr 
Do=aD4+b 
b 
= 255 
0 万 
图 4-1 线性 点 运算 


2. 非 线性 点 运算 

除了 线性 点 运算 外 ,还 有 非 线 性 点 运算 。 一 般 考虑 非 减 (nondecreasing) 的 灰 度 变换 函 
数 , 其 灰 度 变换 关系 如 图 4-2 所 示 。 非 线性 点 运算 灰 度 变换 函数 的 斜率 处 处 为 正 数 , 这 类 函 
数 保留 了 图 像 的 基本 外 貌 。 


输出 
255 


图 4-2 非 线性 点 运算 
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非 线 性 点 运算 的 函数 形式 可 以 表示 为 

Ds = f(Da) (4-2) 

式 中 ,Da 为 输入 点 的 灰 度 值 ; Ds 为 相应 输出 点 的 灰 度 值 ; f 表示 非 线 性 函数 ,函数 表达 式 
需 根 据 具 体 应 用 选择 有 代表 性 的 非 线性 函数 形式 。 式 (4-3) 一 式 (4-5) 是 三 种 典型 的 非 线 
Ds = f(Da) = Da + CDa(D, — DA) (4-3) 

式 中 ,D, 为 灰 度 级 的 最 大 值 ; 参数 C 定义 了 中 间 灰 度 范围 内 的 增加 量 (C 二 0) 或 减少 量 
(C<0) 。 非 线性 点 运算 可 增加 中 间 范 围 像 素 的 灰 度 级 而 只 使 暗 像素 和 亮 像素 进行 较 小 

- D 
5 人 细 |， 0<a<l1 (4-4) 


. 和 
f(D) = 3 


其 中 , 灰 度 级 范围 为 0 一 Du ,在 该 灰 度 级 范围 内 ,直方 图 非 零 。 参 数 a 越 大 ,效果 越 明 显 。 该 
函数 是 基于 正弦 函数 的 非 线性 点 运算 形式 。 这 类 非 线性 单调 点 运算 通过 降低 较 亮 或 较 暗 物 
体 的 对 比 度 来 加 强 灰 度 级 处 于 中 间 范 围 的 物体 的 对 比 度 , 这 类 函数 曲线 为 s 形 ,其 灰 度 变换 
函数 在 中 间 部 分 的 斜率 大 于 1 ,而 两 端 处 斜率 小 于 1 。 


1 Da_1 
/DD = 多 | 二， NE ]] ; 04-5) 
an 2 


该 函数 是 基于 正切 函数 的 非 线 性 点 运算 表达 式 , 同 样 ,参数 a 决定 点 运算 的 效果 。 这 类 
非 线性 单调 点 运算 是 通过 压低 在 中 间 灰 度 级 区 间 的 对 比 度 , 而 将 较 亮 和 较 暗 部 分 的 对 比 度 
加 强 。 该 灰 度 变换 函数 在 中 间 处 的 斜率 小 于 1 ,而 在 靠近 两 端 处 斜率 大 于 1 。 


4.2.2 点 运算 与 直方 图 


点 运算 是 一 种 在 确定 的 函数 关系 下 所 进行 的 像素 变换 运算 ,因此 ,点 运算 之 后 输出 图 像 
和 输入 图 像 之 间 的 直方 图 也 具有 与 变换 函数 相关 联 的 对 应 关系 。 

设 点 运算 之 间 的 函数 关系 为 Ds 一/(Da), 输 入 直方 图 、 灰 度 变 换 函 数 以 及 输出 直方 图 
之 间 的 关系 如 图 4-3 所 示 , 灰 度 值 DA 转换 为 De, 同 样 , 灰 度 值 DA 十 ADA 转换 为 Ds 十 
ADs, 且 在 灰 度 级 LDa ,Da 十 ADA] 之 间 的 所 有 像素 被 转化 到 灰 度 级 [Da ,Ds 十 ADsj] 之 间 , 进 
一 步 可 得 出 , 灰 度 级 [DA ,DA 十 ADA] 之 间 的 输入 像素 的 个 数 等 于 灰 度 级 [Das ,Da 十 ADs] 之 
间 输 出 像素 的 个 数 , 即 


DA+ADA De+ADB 
起 Ha(D)dD -| Hs(D)dD 
当 ADA4 很 小 时 ,ADs 的 取 值 也 较 小 ,因此 ,输入 、 输 出 图 像 明 影 部 分 面积 可 分 别 用 两 个 


小 矩形 的 面积 近似 蔡 代 。 
Hs(Dg)ADs = Ha(Da)ADa (4-6) 
因此 ,输出 直方 图 的 值 为 
Ha(Da) 
Hs(Dsg) = Ha (Da)ADa/ADs = KAD/ LD 


当 AD4 趋 于 0 时 , 取 极 限 ,因而 可 用 微分 表示 为 
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HD f(D) 


Ha(D) 


Ds Dit+ADs 255 


Di 


图 4-3 点 运算 与 直方 图 之 关系 


Hs(Ds) = 


代入 点 运算 的 函数 形式 得 


Hs(Ds) = (4-7) 


4.2.3 ”点 运算 的 应 用 


由 于 点 运算 能 有 规律 地 改变 像素 点 的 灰 度 值 ,因而 点 运算 有 时 又 被 称 为 对 比 度 增 强 或 
灰 度 变换 (gray-scale transformation,GST)。 因 此 ,通过 恰当 定义 数学 运算 的 形式 ,点 运算 
可 用 于 改善 图 像 数 字 化 设备 或 图 像 数 字 显示 设备 的 某 些 局 限 性 。 

1. 对 比 度 增 强 

在 一 些 数字 图 像 中 ,技术 人 员 所 关注 的 特征 可 能 仅 占据 整个 灰 度 级 范围 非常 小 的 一 部 
分 。 点 运算 可 以 扩展 所 关注 部 分 的 灰 度 信息 的 对 比 度 , 使 之 占据 可 显示 灰 度 级 的 更 大 部 分 。 
该 方法 有 时 称 为 对 比 度 增强 (contrast enhancement) 或 对 比 度 拉 伸 (contrast stretching)。 

2. 光度 学 标定 

人 们 常 希 望 数字 图 像 的 灰 度 能 反映 诸如 光照 强度 . 光 密 度 等 某 些 物理 特性 ,通过 去 掉 图 


非 线性 关系 的 仪器 所 数字 化 ,点 运算 可 以 通过 适当 的 灰 度 变换 运算 ,使 灰 度 级 与 光照 强度 的 
等 步 长 增 量 匹配 。 

点 运算 的 另 一 个 用 处 是 变换 灰 度 的 单位 。 假 定 有 一 个 图 像 数字 化 器 ,用 来 数字 化 一 幅 
显微镜 下 观察 到 的 图 像 。 其 产生 的 灰 度 值 与 标本 的 透射 率 呈 线性 关系 ,点 运算 可 用 来 产生 
一 幅 图 像 ,该 图 像 的 灰 度 级 可 代表 光学 密度 的 等 步 长 增 量 。 光 度 学 标定 通常 作为 图 像 数 字 
化 的 软件 部 分 。 
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3. 显示 标定 

一 些 显 示 设 备 通常 具有 能 突出 图 像 视觉 特征 的 优选 灰 度 范围 。 使 用 这 样 的 显示 设备 
时 ,数字 图 像 中 具有 相同 对 比 度 的 较 暗 和 较 亮 的 特征 ,在 显示 时 却 不 能 以 同样 的 性 能 表现 出 
来 。 在 这 种 情况 下 ,用 户 可 利用 点 运算 让 感 兴趣 的 所 有 特征 同等 突出 地 显示 出 来 。 

一 些 显 示 设 备 不 能 保持 数字 图 像 上 像素 的 灰 度 值 和 显示 屏幕 上 相应 点 的 亮度 之 间 的 线 
性 关系 ,同样 ,许多 胶片 记录 仪 不 能 线性 地 将 灰 度 值 转换 为 光 密 度 。 这 一 缺点 也 可 以 通过 点 
运算 予以 克服 , 即 在 图 像 显 示 之 前 , 先 设计 合理 的 点 运算 关系 。 另 外 ,可 将 点 运算 和 显示 非 
线性 组 合 起 来 互相 抵消 ,以 保持 在 显示 图 像 时 的 线性 关系 。 这 一 过 程 就 是 所 谓 显 示 标 定 
(display calibration ) 。 

少数 情况 下 , 非 线 性 显示 关系 对 于 图 像 的 表示 也 具有 一 定 的 作用 。 例 如 ,电视 机 或 
CRT 显示 器 的 yY 校正 就 是 利用 了 这 种 非 线性 关系 ,点 运算 可 纠正 或 调整 显示 的 yY 值 。 

点 运算 有 时 被 视 为 强化 细节 或 增加 图 像 某 些 部 分 的 对 比 度 的 图 像 处 理 步 又 。 然 而 ,由 
于 信息 实际 上 包含 在 数字 图 像 中 ,所 以 ,实际 要 做 的 工作 是 使 感 兴趣 部 分 的 灰 度 级 与 显示 设 
备 的 对 比 度 范围 匹配 起 来 。 显 示 标 定 和 对 比 度 增 强 也 经 常 作 为 数字 图 像 显示 的 软件 部 分 。 

4. 轮廓 线 

点 运算 可 为 图 像 加 上 轮廓 线 。 可 以 应 用 点 运算 进行 阅 值 化 ,根据 灰 度 级 可 将 一 幅 图 像 
划分 成 一 些 不 连接 的 区 域 ,有 助 于 在 后 续 处 理 中 确定 边界 或 用 于 定义 掩 膜 。 

5. 剪裁 

因为 数字 图 像 通常 以 整 型 格式 存储 ,所 以 ,可 用 的 灰 度 级 范围 是 有 限 的 。 对 于 8bit 图 
像 ,在 每 个 像素 值 被 存储 之 前 ,输出 灰 度 级 一 定 要 被 裁剪 到 0 一 255 的 范围 之 内 。 


4.3 代数 运算 


代数 运算 是 指 对 两 幅 输 入 图 像 进行 点 对 点 的 加 、 减 , 乘 、 除 运算 而 得 到 目标 图 像 的 运算 。 
另外 ,还 可 通过 适当 的 组 合 , 形 成 涉及 几 幅 图 像 的 复合 代数 运算 方程 。 图 像 处 理 代数 运 算 的 


四 种 基本 形式 分 别 如 下 : 
C(x,y) = A(z,y)++ B(xz,y) (4-8) 
CCzyy) = A(zsy) — B(xz,y) (4-9) 
Clzx,y) = A(zx,y) Xx B(xz,y) (4-10) 
_ _ A(z,y) 本 
C(x,y) = A(z,y) + Bl(r,y) Bay) (4-11) 


式 中 ,A(z,y) 和 B(xz,y) 为 输入 图 像 表达 式 ; CCz,y) 为 输出 图 像 表 达 式 。 某 些 情 况 下 , 输 
入 图 像 之 一 也 可 以 是 常数 。 在 一 些 特定 情况 下 ,参与 代数 运算 的 输入 图 像 可 能 多 于 两 个 ,如 
用 于 消除 加 性 随机 噪声 的 图 像 相 加 运算 一 般 都 多 于 两 个 输入 图 像 。 


4.3.1 代数 运算 的 意义 


在 数字 图 像 处 理 技术 中 ,代数 运算 具有 非常 广泛 的 应 用 和 重要 的 意义 。 例 如 图 像 相 加 
运算 的 重要 应 用 之 一 是 对 同一 场景 的 多 幅 图 像 求 平 均值 的 运算 , 它 可 以 被 用 于 消除 或 降低 
加 性 随机 噪声 ,并 具有 良好 的 效果 。 图 像 相 加 也 可 用 于 将 一 幅 图 像 的 内 容 和 至 加 到 另 一 幅 图 
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像 上 ,从 而 实现 二 次 曝光 (double-exposure) 。 

图 像 相 减 运算 可 用 于 消除 一 幅 图 像 中 所 不 需要 的 加 性 图 像 , 加 性 图 像 可 能 是 缓慢 变化 
的 背景 阴影 .周期 性 噪声 ,或 在 图 像 上 每 一 像素 点 均 已 知 的 附加 污染 等 。 减 法 运算 还 可 用 于 
检测 同一 场景 中 的 两 幅 图 像 之 间 的 变化 。 例 如 ,通过 对 同一 场景 的 序列 图 像 的 相 减 运算 可 
用 于 检测 物体 的 运动 。 在 计算 用 于 确定 物体 边界 位 置 的 梯度 时 ,也 需要 应 用 图 像 的 相 减 

在 数字 图 像 处 理 中 ,虽然 乘 、 除 运算 应 用 得 相对 少 一 些 , 但 它们 也 具有 很 重要 的 应 用 。 
例如 ,在 获取 数字 化 图 像 过 程 中 ,图 像 数 字 化 设备 对 一 幅 图 像 各 点 的 敏感 程度 不 可 能 完全 相 
同 , 乘 、 除 运算 可 用 于 纠正 这 方面 的 不 利 影响 。 此 外 ,乘法 运算 在 获取 图 像 的 局 部 图 案 时 发 
挥 作用 ,用 一 幅 掩 膜 图 像 (mask image) 乘 以 某 一 图 像 可 遮 住 该 图 像 中 的 某 些 部 分 ,使 其 仅 保 
留 图 像 中 感 兴趣 的 部 分 ,而 除法 运算 还 可 以 产生 对 颜色 和 多 光谱 图 像 分 析 十 分 重要 的 比率 
图 像 。 


4.3.2 加 法 运算 


加 法 运算 通常 用 于 平均 值 降 噪 等 多 种 场合 。 图 像 相 加 一 般 用 于 对 同一 场景 的 多 幅 图 像 
求 平均 ,以 便 有 效 地 降低 加 性 噪声 ,通常 ,图 像 采集 系统 在 采集 图 像 时 有 这 类 参数 可 供 选 择 。 
对 于 一 些 经 过 长 距离 模拟 通信 方式 传送 的 图 像 ( 如 太空 航天 器 传 回 的 星际 图 像 ) 这 种 处 理 是 
不 可 缺少 的 。 当 噪声 可 以 用 同一 个 独立 分 布 的 随机 模型 表示 和 描述 时 , 则 利用 求 平均 值 方 
法 降低 噪声 信号 、 提 高 信 噪 比 非常 有 效 。 

在 实际 应 用 中 ,要 得 到 一 静止 场景 或 物体 的 多 幅 图 像 是 比较 容易 的 。 如 果 这 些 图 像 被 
一 加 性 随机 噪声 源 所 污染 , 则 可 通过 对 多 幅 静 止 图 像 求 平均 值 来 达到 消除 或 降低 噪声 的 目 
的 。 在 求 平均 值 的 过 程 中 ,图 像 的 静止 部 分 不 会 改变 ,而 由 于 图 像 的 噪声 是 随机 性 的 ,各 不 
相同 的 噪声 图 案 累 积 得 很 慢 , 因 此 可 以 通过 多 幅 图 像 求 平均 值 降低 随机 噪声 的 影响 。 

若 有 一 静止 场景 的 图 像 被 加 性 随机 噪声 污染 , 且 已 获得 由 幅 该 静止 场景 图 像 组 成 的 
图 像 集合 , 设 图 像 可 表示 为 


Di(x,y) = S(x,y) + Ni(x,y) (4-12) 
式 中 ,S(x,y) 为 静止 场景 的 理想 图 像 ，N; (zx,y) 表 示 由 于 胶片 的 颗粒 或 数字 化 系统 中 的 电 
子 噪声 所 引起 的 噪声 图 像 。 集 合 中 的 每 幅 图 像 被 不 同 的 噪声 图 像 所 污染 。 虽 然 并 不 能 准确 
获取 这 些 噪声 信息 ,但 通常 情况 下 图 像 的 噪声 信号 都 来 自 于 同一 个 互 不 相干 且 均 值 等 于 零 
的 随机 噪声 样本 集 。 设 P(z,y) 表 示 功 率 信 噪 比 ,对 于 图 像 中 的 任意 像素 点 , 则 P(z,y) 可 
定义 为 


S2(zyy) 


Pr) = NE (4-13) 
对 K 幅 图 像 求 平均 ,可 得 
Biss = LSet (4-14) 
平均 值 图 像 的 功率 信 品 比 为 。 
je S (239) (4-15) 


El [2 NC] } 
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Ni(Czyy) 为 随机 噪声 ,因而 具有 以 下 特性 : 


ELN(z,y)] 一 0 (4-16) 
E[Ni(z,y) + Nj;(z,y)] = ELN;(zx,y)] + ELN; (zx,y)] (4-17) 
ELNi(z,yY)N;(z;y)] = ELN;(z,y)JELN; (zx,y)] (4-18) 

由 此 ,可 以 得 出 
P(r,y) = S20 ipt) (4-19) 


RKELN’ (x,3)] 


因此 ,对 K 幅 图 像 进行 平均 , 则 图 像 中 每 一 点 的 功率 信 品 比 提高 了 倍 。 而 功率 信 噪 
比 与 幅度 信 噪 比 CSNR) 之 间 是 平方 关系 。 故 有 

SNR = VB(z,y) = vV 民 .VECzy) (4-20) 
即 求 平均 值 以 后 ,图 像 的 幅 值 信 噪 比 单 幅 图 像 提高 了 v 开 倍 , 幅 度 信 噪 比 随 着 被 平均 图 
像 数 量 的 增加 而 提高 。 
例 4-1: 图 像 加 法 消除 噪声 的 示例 

如 图 4-4 所 示 是 加 法 消除 噪声 的 示例 。 在 图 4-4(a) 中 天王 1, 表 示 1 幅 噪声 图 像 平均 , 即 
具有 加 性 噪声 的 原始 月 球 照片 ; 图 4-4(b) 中 天王 2, 表 示 2 张 照片 相 加 后 求 平均 ; 图 4-4(c) 中 
开 王 4, 表示 4 张 照片 相 加 后 求 平均 ; 图 4-4(d) 中 天王 16 ,表示 16 张 照 片 相 加 后 求 平均 。 由 于 
相 加 图 像 越 来 越 多 ,SNR 值 不 断 提 高 ,因此 ,图 像 质量 由 (a) 到 (d) 明 显 提高 。 


(a) K=1 (b) K=2 


(© K=4 (d) K=16 
图 4-4 求 平均 消除 加 性 随机 噪声 


4.3.3 减法 运算 


图 像 相 减 常用 于 检测 变化 及 运动 物体 ,图 像 相 减 运算 又 称 为 图 像 差分 运算 。 差 分 方法 
可 以 分 为 可 控制 环境 下 的 简单 差分 方法 和 基于 背景 模型 的 差分 方法 。 在 可 控制 环境 下 ,或 
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者 在 很 短 的 时 间 间 隔 内 ,可 以 认为 背景 是 固定 不 变 的 ,可 以 直接 使 用 差分 运算 检测 变化 及 运 
动物 体 。 

1. 消除 背景 影响 

在 有 些 情况 下 ,背景 对 图 像 中 的 被 研究 物体 具有 不 利 影响 ,这 时 背景 就 成 为 了 噪声 ,可 
以 利用 图 像 减 法 运算 消除 背景 噪声 的 影响 。 

例 4-2: 减法 消除 背景 噪声 

如 图 4-5 所 示 , 图 4-5(a) 表 示 一 幅 数 字 化 的 光学 显 微 图 像 ( 在 每 幅 图 像 的 下 面 为 其 各 自 
的 灰 度 直方 图 ) ,该 图 像 含有 两 群 人 的 染色 体 ,图 像 被 缓慢 变化 的 背景 影 调 图 像 所 污染 ; 在 
图 4-5(b) 中 ,显微镜 载 物 台 被 移出 使 得 物镜 下 形成 空白 区 域 ,因此 ,图 像 (b) 只 含有 背景 影 
调 图 案 ; 图 像 (o) 是 从 图 (a) 中 被 减 去 背景 图 像 (b) ,对 每 个 像素 点 的 灰 度 值 再 加 上 一 个 常 
数 , 使 图 像 的 整体 亮度 一 致 ,本 实验 的 常数 为 64 时 ,结果 图 像 具 有 大 致 一 致 的 亮度 。 


(a) 数字 显 微 图 像 (b) 背景 图 像 (0) 目标 图 像 
图 4-5 消除 背景 图 像 的 应 用 


注意 图 4-5(c) 中 的 直方 图 与 理想 的 直方 图 略 有 不 同 , 特 别 是 一 些 像素 的 灰 度 值 小 于 理论 
上 的 最 小 值 64。 这 是 由 于 数字 化 过 程 中 的 噪声 所 引起 的 ,数字 化 器 的 噪声 使 背景 在 图 4-5(a) 
与 (b) 中 并 不 具有 完全 相同 的 灰 度 值 。 

2. 差 影 法 

所 谓 差 影 法 ,实际 上 就 是 图 像 的 减法 运算 (又 称 减 影 技 术 ) ,是 指 将 同一 景物 在 不 同时 间 
拍摄 的 图 像 或 同一 景物 在 不 同 波段 的 图 像 相 减 。 差 值 图 像 提 供 了 图 像 间 的 差异 信息 ,能 用 
于 指导 动态 监测 ,运动 目 标的 检测 和 跟踪 、 图 像 背 景 的 消除 及 目标 识别 等 。 

差 影 法 在 自动 现场 监测 等 领域 具有 广泛 的 运用 。 可 以 应 用 在 监控 系统 中 ,在 银行 金库 
内 ,摄像 头 每 间隔 某 一 固定 时 间 ( 如 10s) 拍 摄 一 幅 图 像 , 并 与 上 一 幅 图 像 进 行 差 影 运算 ,如 
果 图 像 差别 超过 了 预先 设置 的 阔 值 , 则 表明 可 能 有 有 异常 情况 发 生 , 应 自动 或 以 某 种 方式 报 
警 。 差 影 法 可 用 于 检测 变化 目标 及 遥感 图 像 的 动态 监测 ; 利用 差 值 图 像 可 以 发 现 森 林 火 
灾 、 洪 水 泛滥 ,监测 灾情 变化 及 估计 损失 等 ; 也 可 用 于 监测 河口 海岸 的 泥 沙 淤积 及 监视 江 
河 \ 湖 泊 、 海 岸 等 的 污染 。 利 用 差 值 图 像 还 能 鉴别 出 耕地 及 不 同 的 作物 覆盖 情况 。 

差 影 技 术 还 可 用 于 消除 图 像 背景 。 例 如 ,该 技术 可 用 于 诊断 印刷 线路 板 及 集成 电路 掩 
膜 的 缺陷 。 特 别 是 用 于 血管 造影 技术 中 , 肾 动 脉 造影 术 对 诊断 肾脏 疾病 有 独特 优势 。 为 了 
减少 误诊 ,人 们 希望 提供 反映 游离 血管 的 清晰 图 像 。 通 常 的 肾 动脉 造影 在 造影 剂 注入 后 , 虽 
然 能 够 看 出 肾 动 脉 血 管 的 形状 及 分 布 ,但 由 于 肾脏 周围 血管 受到 疹 椎 及 其 他 组 织 影像 的 重 
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释 ,难以 得 到 理想 的 游离 血管 图 像 。 对 此 ,可 摄制 出 肾 动脉 造影 前 后 的 两 幅 图 像 , 相 减 后 就 
能 把 峭 椎 及 其 他 组 织 的 影像 去 掉 , 而 仅 保留 血管 图 像 。 此 外 ,电影 特技 中 应 用 的 “ 蓝 幕 ”" 技 
术 , 其 实 也 包含 差 影 法 的 基本 原理 。 

在 某 些 特定 情况 下 , 差 影 法 可 以 用 于 混合 图 像 的 分 离 , 如 例 4-3 所 示 。 

例 4-3: 差 影 法 分 离 图 像 

如 图 4-6 所 示 是 图 像 减 法 运算 的 示例 。 图 4-6(a) 为 某 种 原因 所 形成 的 混合 图 像 ,已 知 该 
混合 图 像 是 由 (b) 和 (c) 生 加 而 成 (或 由 于 两 次 曝光 而 成 ), 因 此 ,可 以 利用 差 影 法 ,以 图 4-6(a) 
和 图 4-6(b) 进 行 差 影 , 即 可 得 到 图 4-6(c) 所 示 结 果 。 


(a) 混合 图 像 (b) 被 减 图 像 (c) 差 影 图 像 
图 4-6 差 影 法 用 于 图 像 分 离 
图 像 在 进行 差 影 法 运算 时 必须 使 两 相 减 图 像 的 对 应 点 位 于 空间 同一 目标 点 上 。 和 否则 ， 
必须 先 作 几何 校正 与 配 准 再 进行 求 差 运算 。 当 将 一 个 场景 中 的 系列 图 像 相 减 用 来 检测 运动 
或 其 他 变化 时 ,难以 保证 准确 对 准 , 这 时 就 需要 更 进一步 的 分 析 。 例 如 , 设 差 图 像 由 下 式 


给 定 : 


CCz,y) = A(zx,y) — A(zt Azr,y) (4-21) 
如 果 Az 很 小 ,那么 式 (4-21) 可 以 近似 为 
CCzyy) ~ A DA (4-22) 


由 于 这 A(z,y) 本 身 也 是 一 幅 图 像 ,其 直方 图 以 HH'(D) 表 示 , 因 此 , 式 (4-22) 表 示 的 位 
移 差 图 像 的 直方 图 为 


a a 
HD ~ 直 H( 臣 ] (4-23) 


式 (4-23) 表 明 , 减 去 稍微 有 些 对 不 准 的 原 图 像 的 复制 图 像 , 可 以 得 到 偏 导数 图 像 , 偏 导 
数 的 方向 为 图 像 位 移 方 向 。 
3. 求 梯度 幅度 
图 像 的 减法 运算 也 可 应 用 于 求 图 像 梯 度 函 数 。 梯 度 是 数学 与 场 论 中 的 概念 , 它 是 向 量 
函数 ,前 述 章节 中 已 经 介绍 了 关于 梯度 的 概念 ,其 定义 形式 为 
Vr =iH+i (4-24) 
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梯度 幅度 可 由 下 式 表示 : 
| Vf(z,y) |= (2) 卡 (四 (4-25) 
考虑 到 运算 的 方便 性 ,梯度 幅度 可 由 下 式 近 似 计算 : 
| VCz,y) |= max[| FGz,y) 一 zxz 十 1,y) | 一 | FCz,y) 一 FrGzy 十 1) |] (4-26) 
也 就 是 说 ,梯度 可 近似 取 值 为 水 平方 向 相 邻 像素 之 差 的 绝对 值 和 垂直 方向 相 邻 像素 之 
差 的 绝对 值 中 的 较 大 者 。 在 图 像 中 物体 的 边缘 属于 斜率 陡峭 之 处 ,梯度 值 一 般 较 大 。 梯 度 
运算 可 以 获取 图 像 内 部 的 边缘 信息 。 如 图 4-7 所 示 是 图 像 梯度 运算 的 示例 。 对 于 肌肉 活 组 
织 检 查 标本 的 细胞 显 微 图 像 之 梯度 幅度 图 ,梯度 幅度 在 边缘 处 很 高 ,而 在 均匀 的 肌肉 纤维 的 
内 部 ,梯度 幅度 很 低 。 


(a) 肌肉 纤维 (b) 梯度 图 像 
图 4-7 梯度 幅度 图 像 


4.3.4 乘法 运算 


乘法 运算 可 用 来 遮 住 图 像 的 某 些 部 分 ,其 典型 运用 是 用 于 获得 掩 膜 图 像 。 对 于 需要 保 
留 下 来 的 区 域 , 拖 膜 (mask) 图 像 的 值 置 为 1, 而 在 需要 被 抑制 掉 的 区 域 , 掩 膜 图 像 的 值 演 为 
0。 乘 法 获取 掩 膜 图 像 如 例 4-4 所 示 。 

例 4-4: 乘法 获取 掩 膜 图 像 

如 图 4-8 所 示 是 图 像 乘 法 运算 的 示例 。 原 图 像 乘 上 掩 膜 图 像 ,可 抹 去 图 像 的 某 些 部 分 ， 
即使 该 部 分 为 0。 然后 可 利用 一 个 互补 的 掩 膜 来 抹 去 第 二 幅 图 像 中 的 另 一 些 区 域 ,而 这 些 
区 域 在 第 一 幅 图 像 中 被 完整 地 保留 了 下 来 。 两 幅 经 过 掩 膜 的 图 像 相 加 可 得 最 终结 果 。 
图 4-8(c) 为 图 4-8(a) 与 图 4-8(b) 相 乘 的 结果 。 

一 般 情 况 下 ,利用 计算 机 图 像 处 理 软件 生成 掩 膜 图 像 的 步骤 如 下 : 

(1) 新 建 一 个 与 原始 图 像 大 小 相同 的 图 层 ,图 层 文件 一 般 保存 为 二 值 图 像 文 件 。 

(2) 用 户 在 新 建 图 层 上 人 工 勾 绘 出 所 需要 保留 的 区 域 ,区 域 的 确定 也 可 以 由 其 他 二 值 
图 像 文 件 导 入 或 由 计算 机 图 形 文件 (矢量 ) 经 转换 生成 。 

(3) 确定 局 部 区 域 后 ,将 整个 图 层 保存 为 二 值 图 像 , 选 定 区 域内 的 像素 点 值 为 1, 非 选 定 
区 域 像素 点 值 为 0。 
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(b) 掩 膜 图 像 


(0) 局 部 图 像 


图 4-8 乘法 运算 在 掩 膜 图 像 中 的 应 用 


(4) 将 原始 图 像 与 (3) 形 成 的 二 值 图 像 进行 乘法 运算 , 即 可 将 原始 图 像 选 定 区 域外 像素 
点 的 灰 度 值 置 0, 而 选 定 区 域内 像素 的 灰 度 值 保 持 不 变 , 得 到 与 原始 图 像 分 离 的 局 部 图 像 ， 
即 扼 膜 图 像 。 

掩 膜 技 术 也 可 以 灵活 应 用 ,如 可 以 增强 选 定 区 域外 的 图 像 而 对 区 域内 的 图 像 不 做 处 理 ， 
这 时 ,只 需 将 二 值 图 像 中 区 域外 像素 点 置 1 而 区 域内 的 像素 点 置 0 即 可 。 

掩 膜 图 像 技 术 还 可 以 应 用 于 图 像 局 部 增强 ,一般 的 图 像 增强 处 理 都 是 对 整 幅 图 像 进行 
操作 ,但 在 实际 应 用 中 ,往往 需要 只 对 图 像 的 某 一 局 部 区 域 进行 增强 ,以 突出 某 一 具体 的 目 
标 , 若 这 些 局 部 区 域 所 包含 的 像素 点 数目 相对 于 整 幅 图 像 来 讲 非常 小 ,在 计算 整 幅 图 像 的 统 
计量 时 其 影响 几乎 可 以 忽略 不 计 , 因 此 以 整 幅 图 像 的 变换 或 转移 函数 为 基础 的 增强 方法 对 
这 些 局 部 区 域 的 影响 也 非常 小 ,难于 达到 理想 的 增强 效果 。 


4.3.5 除法 运算 

除法 运算 的 典型 运用 是 比值 图 像 处 理 。 例 如 ,除法 运算 可 用 于 校正 成 像 设 备 的 非 线性 
影响 ,在 特殊 形态 的 图 像 ( 如 CT 为 代表 的 医学 图 像 ) 处 理 中 用 到 ; 此 外 ,除法 运算 还 经 常用 
于 消除 图 像 数字 化 设备 随 空 间 变化 所 产生 的 影响 ,并 可 用 于 产生 多 光谱 图 像 处 理 中 非常 有 
用 的 比率 图 像 , 有 兴趣 的 读者 可 参阅 这 方面 的 专著 。 


4.4 几何 运算 


几何 运算 又 称 为 几何 变换 , 它 是 图 像 处 理 和 图 像 分 析 的 重要 内 容 之 一 。 通 过 几何 运算 ， 
可 以 根据 应 用 的 需要 使 原 图 像 产 生 大 小 、 形 状 和 位 置 等 各 方面 的 变化 。 简 单 地 说 ,几何 变换 
可 改变 像素 点 所 在 的 几何 位 置 ,以 及 图 像 中 各 物体 之 间 的 空间 位 置 关系 ,这 种 运算 可 以 被 看 
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成 是 将 各 物体 在 图 像 内 移动 ,特别 是 图 像 具 有 一 定 的 规律 性 时 ,一 个 图 像 可 以 由 另 一 个 图 像 
通过 几何 变换 来 产生 。 几 何 变换 的 效果 可 形象 化 地 理解 为 把 图 像 看 成 一 张 橡皮 膜 , 对 该 膜 
做 任意 伸展 ,并 在 若干 点 把 变形 后 的 橡皮 膜 固定 下 来 的 结果 。 实 际 上 ,几何 变换 的 结果 可 以 
比 上 述 比 喻 灵活 得 多 ,一 个 不 受 约束 的 几何 变换 ,可 将 输入 图 像 中 的 一 个 点 变换 到 输出 图 像 
中 任意 位 置 。 几 何 变换 不 仅 提供 了 产生 某 些 特殊 图 像 的 可 能 ,甚至 还 可 以 使 图 像 处 理 程序 
设计 简单 化 。 从 变换 性 质 分 ,几何 变换 可 以 分 为 图 像 的 位 置 变换 (平移 、 镜 像 . 旋 转 ) ,形状 变 
换 ( 放 大 、 缩 小 和 错 切 ) 以 及 图 像 的 复合 变换 等 。 


4.4.1 齐 次 坐标 


数字 图 像 是 对 一 幅 连 续 图 像 的 坐标 和 色彩 都 离散 化 了 的 图 像 ,坐标 的 离散 通过 采样 完 
成 ,色彩 的 离散 通过 量化 完成 ,因此 可 以 用 二 维 数组 fCz,y) 表 示 , 其 中 z 和 y 表示 像素 点 的 
坐标 位 管 ,f(z,y) 代 表 图 像 在 点 (zx,y) 的 灰 度 值 (如 果 所 处 理 的 是 彩色 图 像 , 则 通过 RGB 值 
表示 )。 图 像 几 何 变 换 的 基础 是 代数 和 几何 学 。 几 何 变 换 可 以 使 用 户 获得 大 小 、 形 状 和 位 置 
都 发 生变 化 的 各 种 图 像 。 为 讨论 和 研究 问题 的 方便 ,无 论 图 像 比例 缩放 、 旋 转 、 反 射 和 错 切 ， 
还 是 图 像 的 平移 、 透 视 变 换 及 复合 变换 等 ,几何 变换 一 般 采 用 如 下 形式 : 
Xl Xo a bl[zo 
[nl ,| (20 
1 Yo c djJLy 
根据 几何 学 知识 ,上 述 变 换 可 以 实现 图 像 各 像素 点 以 坐标 原点 的 比例 缩放 反射 、 错 切 
和 旋转 等 各 种 变换 ,但 是 上 述 2X2 变换 矩阵 工 不 能 实现 图 像 的 平移 以 及 绕 任 意 点 的 比例 缩 
因此 ,为 了 能 够 用 统一 的 矩阵 线性 变换 形式 表示 和 实现 这 些 常见 的 图 像 几 何 变换 ,就 需 
要 引入 一 种 新 的 坐标 , 即 齐 次 坐标 。 采 用 齐 次 坐标 可 以 实现 上 述 各 种 几何 变换 的 统一 表示 。 
若 将 点 Au(zo ,yo) 在 水 平方 向 (z 方 向) 平移 Az 距离 ,在 垂直 方向 (y 方向 ) 平 移 Ay 距 
离 到 新 的 位 置 A1(zi ,yi) ,如 图 4-9 所 示 , 则 新 位 置 Ai(Cziyyy) 点 的 坐标 为 


Xi = To 十 Az 
| (4-28) 


式 (4-28) 可 以 表示 为 


[lls sl bees Ca 
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但 却 无 法 表示 为 式 (4-27) 的 形式 , 即 不 能 表示 为 


I 


由 于 矩阵 T 中 没有 引入 平移 常量 ,无 论 a.b、c.d 取 什 么 值 ,都 不 能 实现 式 (4-28) 所 示 的 平移 
功能 。 因 此 ,为 了 用 式 (4-27) 表 示 平 移 变换 ,需要 对 式 (4-27) 进 行 改进 。 
根据 矩阵 运算 规律 ,可 以 将 了 和 矩阵 扩展 为 如 下 2X3 变换 矩阵 ,其 形式 为 
1 0 Ar 
z=| ] (4-30) 
0 1 Ay 


若 将 矩阵 工分 块 ,该 矩阵 的 第 一 二 列 构成 单位 矩阵 ,第 三 列 元 素 分 别 为 xy 方向 的 平 
移 量 。 扩 展 后 变换 矩阵 为 2X3 矩阵 ,而 矩阵 相 乘 时 要 求 前 者 的 列 数 与 后 者 的 行 数 相等 , 因 
此 ,应 在 坐标 列 矩阵 [z ”yjJ” 中 引入 第 三 个 元 素 ,扩展 为 3X1 的 列 矩阵 [z y 1]"。 于 
是 ,以 (zyy,1) 表 示 二 维 坐标 点 (z,y) ,就 可 以 实现 点 的 平移 变换 。 变 换 形式 为 


Mi 
Wy yo (4-31) 
yn 0 1 Ay 1 
通过 上 述 变 换 虽然 可 以 实现 图 像 各 像素 点 的 平移 变换 ,但 为 变换 运算 时 更 方便 ,一 般 将 
2X3 阶 变换 矩阵 T 了 进一步 扩充 为 3X3 方 阵 , 即 采用 如 下 变换 矩阵 : 
1 0 Me 
T=|0 1 Ay (4-32) 
| 
于 是 ,平移 变换 可 以 用 如 下 形式 表示 : 
1 1 ‘0 Axlras 
yl=|10 1 Aylly (4-33) 
| 0 1 和 


由 此 可 知 , 引 入 附加 坐标 后 ,将 2X2 矩阵 扩展 为 3X3 矩阵 ,就 可 以 对 各 种 几何 变换 进 
行 统一 表示 。 这 种 以 n 十 1 维 向 量 表示 n 维 向 量 的 方法 称 为 齐 次 坐标 表示 法 。 齐 次 坐标 的 
几何 意义 相当 于 点 (xz,y) 投 影 在 xyz 三 维 立 体 空间 的 < 二 1 的 平面 上 。 


4.4.2 ”图 像 平移 


平移 是 日 常生 活 中 最 普遍 的 方式 之 一 ,例如 开学 时 教室 里 课 桌 的 重新 摆 放 等 都 可 以 视 
为 平移 运动 。 图 像 的 平移 是 将 一 幅 图 像 上 的 所 有 像素 点 都 按 给 定 的 偏 移 量 沿 x 方向 (方向 
水 平 ) 和 y 方向 (垂直 方向 ) 进 行 移动 ,如 图 4-10 所 示 。 图 像 的 平移 是 图 像 几 何 变换 中 最 简 
单 的 变换 之 一 。 

若 点 Au (zo ,yo ) 进 行 平 移 后 ,被 移 到 A(z,y) 位 置 ,其 中 工 方向 的 平移 量 为 Ar,y 方向 
的 平移 量 为 Ay, 那 么 ,点 ACz,y) 的 坐标 为 


工 一 Zo 十 Ar 


2 一 名 十 Ay 
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0 x 0 三 一 > 
=2 上 -一 | 
Ay=2 
了 菇 
(a) (b) 


图 4-10 图 像 的 平移 


利用 齐 次 坐标 ,点 A(z,y) 的 坐标 可 以 表示 为 
党 1 & WE 
y|=|10 1 四 国 (4-34) 
1 0 0 1 1 
相应 地 ,也 可 以 根据 点 ACz,y) 求 解 原始 点 Au(zo,yo) 的 坐标 , 即 
Xo lL 0 A 
|=|0 1 —Ay||; (4-35) 
1 小 站 1 1 


显然 ,以 上 两 个 变换 矩阵 互 为 逆 矩 阵 。 

图 像 平 移 变 换 的 特点 是 平移 后 的 图 像 与 原 图 像 完全 相同 ,平移 后 新 图 像 上 的 每 一 点 都 
可 以 在 原 图 像 中 找到 对 应 的 点 。 以 图 4-11 为 例 , 对 于 新 图 中 的 像素 点 (0,0) ,代入 式 (4-35) 
可 以 求 出 对 应 原始 图 像 中 的 像素 (一 2, 一 2) ,该 点 不 在 原始 图 像 中 。 对 于 不 在 原 图 像 中 的 
点 ,可 以 直接 将 它 的 像素 值 统一 设置 为 0 或 者 255, 对 于 灰 度 图 像 则 为 黑色 或 白色 。 反 之 , 若 某 
像素 点 不 在 新 图 像 中 ,同样 说 明 原 始 图 像 中 有 某 些 像素 点 被 移出 了 显示 区 域 。 如 图 4-11 所 
示 是 图 像 平移 变换 的 示例 。 图 4-11(a) 是 平移 前 的 原始 图 像 ,图 4-11(b) 是 水 平 、 垂 直方 向 
都 平移 100 个 像素 后 的 图 像 ,经 过 平移 之 后 ,原始 图 像 的 一 些 像素 点 被 移出 了 显示 区 域 , 若 
想 保留 全 部 图 像 ,应 扩大 新 图 像 的 显示 区 域 。 


二 -和 - res 
(a) 平移 前 的 图 像 (b) 平移 后 的 图 像 
图 4-11 图 像 的 平移 


102 大 | 数字 图 像 处 理 及 应 用 一 一 使 用 MATLAB 分 析 与 实现 


4.4.3 比例 缩放 


通常 情况 下 ,数字 图 像 的 比例 缩放 是 指 将 给 定 的 图 像 在 工 方向 和 > 方向 按 相 同 的 比例 
缩放 a 倍 ,从 而 获得 一 幅 新 的 图 像 ,又 称 为 全 比例 缩放 。 如 果 工 方向 和 > 方向 缩放 的 比率 
不 同 , 则 图 像 的 比例 缩放 会 改变 原始 图 像 像素 间 的 相对 位 置 ,产生 几 何 畸 变 。 设 原始 图 像 中 
的 点 Ao (zo，yo) 比 例 缩放 后 ,在 新 图 像 中 的 对 应 点 为 AiCzyy), 则 Au(zo,yo) 和 Ai(Cr， 
1) 之 间 华 标 关系 可 表示 为 
四 (4-36) 
1 


若 比 例 缩放 所 产生 的 图 像 中 的 像素 在 原 图 像 中 没有 相对 应 的 像素 点 ,就 需要 进行 灰 度 
值 的 插值 运算 。 一 般 有 以 下 两 种 插值 处 理 方法 。 
(1) 直接 赋值 为 和 它 最 相近 的 像素 灰 度 值 ,这 种 方法 称 为 最 邻近 插值 法 (nearest 
neighbor interpolation) ,该 方法 的 主要 特点 是 简单 .计算 量 很 小 ,但 可 能 会 产生 马赛 克 现象 。 
(2) 通过 其 他 数学 插值 算法 来 计算 相应 像素 点 的 灰 度 值 ,这 类 方法 处 理 效 果 好 ,但 运算 
量 会 有 所 增加 。 
在 式 (4-36) 所 表示 的 比例 缩放 中 , 若 ac 二 1. 则 图 像 被 放大 ; 若 a 二 1, 则 图 像 被 缩小 。 以 
a 二 1/2 为 例 , 即 图 像 被 缩小 为 原始 图 像 的 一 半 。 图 像 被 缩小 一 半 以 后 根据 目标 图 像 和 原始 
图 像 像 素 之 间 的 关系 ,有 如 下 两 种 缩小 方法 。 
第 一 种 方法 如 图 4-12 所 示 ,此 时 缩放 前 后 图 像 间 像素 点 的 对 应 关系 如 下 : 
(0.0) (0,0) 
(051) #——» 《02) 
(0.2) < ~ (0,4) 
(0,3) < ~ (0,6) 
(ln0) <——» 250) 
缩小 图 像 1(1,0) 一 一 > (4,0)。 原始 图 像 


即 


(3,0) < 一 ~ (6,0) 
《31) 二 > 《6 人 
(3,2) oo——> (6,4) 
(3,3) (6,6) 
依 此 类 推 ,可 以 逐 点 计算 缩小 图 像 各 像素 点 的 值 ,图 像 缩小 之 后 所 承载 的 信息 量 为 原始 
图 像 的 50% , 即 在 原始 图 像 上 , 按 行 优先 的 原则 ,对 于 所 处 理 的 行 ,每 隔 一 个 像素 取 一 点 ,每 
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(a) (b) 
图 4-12 图 像 缩 小 一 半 ( 偶 数 行 和 偶数 列 构成 新 的 图 像 ) 


隔 一 行进 行 操作 。 也 就 是 说 , 取 原 始 图 像 的 偶数 行 和 偶数 列 构成 新 的 图 像 。 
第 二 种 方法 是 取 原始 图 像 奇 数 行 和 奇数 列 组 成 新 图 像 ,如 图 4-13 所 示 。 


Cr> 


(a) (b) 
图 4-13 图 像 缩小 一 半 ( 奇 数 行 和 奇数 列 构成 新 的 图 像 ) 


如 果 图 像 按 任意 比例 缩小 , 则 以 类 似 的 方式 按 比例 选择 行 和 列 上 的 像素 点 。 若 工 方向 
与 y 方向 缩放 比例 不 同 ,这 种 变换 将 会 使 缩放 以 后 的 图 像 产生 几何 畸变 。 图 像 工 方向 和 y 
方向 的 不 同比 例 缩 放 的 变换 公式 为 
2 a 0 0 
Rl 0 0 0||y |， 
1 (on 丽人 训 

图 像 缩小 变换 是 在 已 知 的 图 像 信息 中 以 某 种 方式 选择 需要 保留 的 信息 。 反 之 ,图 像 的 
放大 变换 则 需要 对 图 像 尺 寸 经 放大 后 所 多 出 来 的 像素 点 填 入 适当 的 像素 值 ,这 些 像 素 点 在 
原始 图 像 中 没有 直接 对 应 点 ,需要 以 某 种 方法 进行 估计 。 以 a=5 二 2 为 例 , 即 原始 图 像 按 全 
比例 放大 2 倍 , 实 际 上 ,这 是 将 原始 图 像 每 行 中 各 像素 点 重复 取 值 一 遍 , 然 后 每 行 重复 一 次 。 
根据 理论 计算 ,放大 以 后 图 像 中 的 像素 点 (0,0) 对 应 于 原始 图 中 的 像素 点 (0,0),(0,2) 对 应 
于 原始 图 像 中 的 (0,1); 但 放大 后 图 像 的 像素 点 (0,1) 对 应 于 原始 图 中 的 像素 点 (0,0. 5)， 
(1,0) 对 应 于 原始 图 中 的 (0. 5,0) ,原始 图 像 中 不 存在 这 些 像 素 点 ,那么 放大 图 像 如 何 处 理 这 
些 问题 呢 ? 以 像素 点 (0,0. 5) 为 例 , 这 时 可 以 采取 以 下 两 种 方法 和 原始 图 像 对 应 ,其 余 点 依 
此 类 推 。 

(1) 将 原始 图 中 的 像素 点 (0,0.5) 近 似 为 原始 图 像 的 像素 点 (0,0) 。 

(2) 将 原始 图 中 的 像素 点 (0,0.5) 近 似 为 原始 图 像 的 像素 点 (0,1) 。 


Xo 


T= Q 天 0 (4-37) 
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以 图 4-14 所 示 的 一 段 直线 为 例 来 说 明 这 两 种 放大 的 细微 差别 (为 讨论 问题 方便 ,图 中 


对 原始 图 像 和 放大 图 像 均 已 标注 像素 坐标 值 ) 。 


wwb 一 口 


图 4-14 放大 前 的 原始 图 像 
若 采取 第 一 种 方法 , 则 原始 图 像 和 放大 图 像 的 像素 对 应 关系 如 下 : 


(0,0) 


放大 图 像 


其 对 应 的 放大 图 像 如 图 4-15 所 示 。 


012 


《0 视 】 二 一 一 全 
《250》 法 一 一 六 
(1,1) < 
(232) 二 一 
(213) 二 全 
92 二 一 全 
(i 
(4,4) < 
(4,5) ~ 
(554) 二 


(i 和» 


(0 
(0 
(0 
(0 
(1 


(1,1) 
(1,1) 
Gs 
(2,2 
(2,2 
(2,2 
(2,2 


»0) 
,0) 
,0) 
0) 
,1) 


原始 图 像 


NWO 


图 4-15 按 最 近邻 域 法 放大 2 倍 的 图 像 
若 采取 第 二 种 方法 , 则 原始 图 像 和 放大 图 像 的 像素 对 应 关系 如 下 : 


放大 图 像 


(0， 
(0， 
,0) 
,1) 
,2) 
,1) 
,2) 
,3) 
,2) 
,3) 
,4) 
,3) 
,4) 
,5) 
,6) 
,3) 
,6) 


(6 


0) 
1) 


(3， 


3) 
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其 对 应 的 放大 图 像 如 图 4-16 所 示 ,因此 ,两 种 放大 方式 具有 一 定 差别 。 


01 


图 4-16 按 插值 法 放大 2 倍 的 图 像 
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- 般 地 , 按 比例 将 原 图 像 放 大 a 倍 时 ,如 果 按 照 最 近邻 域 法 , 则 需要 将 一 个 像素 值 添 在 
新 图 像 的 aXa 的 方块 中 ,如 图 4-17 所 示 。 因 此 ,如 果 放 大 倍数 过 大 ,按照 这 种 方法 填充 灰 
度 值 会 出 现 马 赛 克 效 应 。 为 了 避免 马赛 克 效 应 ,提高 几何 变换 后 的 图 像 质量 ,可 以 采用 不 同 
复杂 程度 的 线性 插值 法 填充 放大 后 所 多 出 来 的 相关 像素 点 的 灰 度 值 。 


4.4.4 镜像 变换 


镜像 变换 也 是 与 人 们 日 常生 活 密切 相关 的 一 种 变换 ,图 像 的 镜像 (mirror) 变 换 不 改变 
图 像 的 形状 。 图 像 的 镜像 变换 包括 水 平 镜 像 和 垂直 镜像 两 种 。 图 像 的 水 平 镜像 变换 是 将 图 
E 直 中 轴线 为 中 心 进行 镜像 对 换 , 如 图 4-18(b) 所 示 ; 图 像 的 


像 左 半 部 分 和 右 半 部 分 以 图 像 对 
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| 口 14 下 天 4 售 ) > | | 


(a) 


(b) 
图 4-17 按 最 近邻 域 法 放大 5 倍 的 图 像 


垂直 镜像 变换 是 将 图 像 上 半 部 分 和 下 半 部 分 以 图 像 水 平 中 轴线 为 中 心 进行 镜像 对 换 , 如 
图 4-18(c) 所 示 。 


水 平 镜像 > 
Ga 册 nt 


(9) 


图 4-18 图 像 的 镜像 位 置 关系 


1. 水 平 镜像 


设 点 Ao (zo ,yo) 进 行 镜像 后 的 对 应 点 为 A(z,y) ,图 像 高 度 为 有 ,宽度 为 w, 原 始 图 像 中 
的 点 Ao (zo ,yo) 经 过 水 平 镜像 后 坐标 将 变 为 


工 一 也 一 Zo 
| (4-38) 
一 3 


图 像 的 水 平 镜像 变换 用 矩阵 形式 表示 为 


一 1 0 wl]zo 
vy L ll (4-39) 
0: 0D: 1 1 


同样 也 可 以 根据 点 A(z,y) 求 解 原始 点 Ao(zxo ,yo) 的 坐标 ,矩阵 表示 形式 为 


Zo 一 
oa 1 | (4-40) 
GY 用 站 志 
例 4-5: 图 像 水 平 镜像 


如 图 4-19 所 示 为 图 像 水 平 镜像 的 变换 示例 。 图 4-19(a) 为 原始 图 像 ,图 4-19(b) 为 原始 
图 像 经 水 平 镜像 变换 以 后 的 图 像 。 
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(a) 原始 图 像 (b) 水 平 镜像 
4-19 图 像 的 水 平 镜像 


2. 垂直 镜像 
对 于 垂直 镜像 变换 , 设 点 Au(zo,yo) 经 过 垂直 镜像 后 将 变 为 点 A(z,y) ,原始 图 像 中 的 
点 Au(zo,yo) 经 过 垂直 镜像 后 坐标 将 变 为 


并 一 zo 
| (4-41) 
?一天 一 和 
图 像 的 垂直 镜像 变换 也 可 以 用 矩阵 变换 表示 ,其 矩阵 表示 形式 为 
i 1 0 01]Tzo 
: 一 |0 一 1 hlly (4-42) 
1 0 1 二 1 


垂直 镜像 也 可 以 根据 点 ACz,y) 求 解 原始 点 Ao (zo ,yo) 的 坐标 ,矩阵 表示 形式 为 
和 1 Vv 
> 到, 三 记 中 (4-43) 
1 TI1 
例 4-6: 图 像 垂 直 镜 像 
如 图 4-20 所 示 为 图 像 垂 直 镜 像 变换 示例 。 图 4-20(a) 为 原始 图 像 , 图 4-20(b) 为 原始 图 
像 经 垂直 镜像 变换 以 后 的 图 像 。 
4.4.5 旋转 变换 
图 像 的 旋转 变换 是 几何 学 中 研究 的 重要 内 容 之 一 。 一 般 情 况 下 ,图像 的 旋转 变换 是 指 
以 图 像 的 中 心 为 原点 ,将 图 像 上 的 所 有 像素 都 旋转 同一 个 角度 的 变换 。 图 像 经 过 旋转 变换 
之 后 ,图 像 的 位 置 发 生 了 改变 ,但 旋转 后 ,图 像 的 大 小 一 般 会 改变 。 和 平移 变换 一 样 ,在 图 像 


旋转 变换 中 既 可 以 把 转 出 显示 区 域 的 图 像 截 去 ,也 可 以 扩大 显示 区 域 的 图 像 范围 以 显示 图 
像 的 全 部 。 
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(a) 原始 图 像 (b) 垂直 镜像 


图 4-20 图 像 的 垂直 镜像 
设 原始 图 像 的 任意 点 Au (zo ,yo) 经 旋转 B 角度 以 


-Pp 
后 到 新 的 位 置 A(z,y), 为 表示 方便 ,采用 极 坐 标 形式 
表示 ,原始 点 的 角度 为 a, 如 图 4-21 所 示 。 员 
根据 极 坐标 与 二 维 垂直 坐标 的 关系 ,原始 图 像 的 
点 Auo(Czoyyo) 的 zx 和 > 坐标 为 Aolxon yo) 
Xo = recosa 图 4-21 图 像 旋 转 
| (4-44) 
Yo = rsina 
旋转 到 新 位 置 以 后 点 A(z,y) 的 坐标 为 
工 一 rcos(a 一 有 ) = rcosacosB++ rsinasinB 
| (4-45) 
y= rsin(a—Bp) = rsinacos8 一 rcosasin8 
由 于 旋转 变换 需要 以 点 Au (zo ,yo) 表 示 点 ACz,y) ,因此 对 上 式 进 行 简化 ,可 得 出 
工 一 zocosp 十 yosinp 
| (4-46) 
y =— zosinB + yocosp 


同样 ,图 像 的 旋转 变换 也 可 以 用 矩阵 形式 表示 为 


小 cosB sing 0][zo] 
y|=|—sing cosB 0|| (4-47) 
1 0 0 1 1 J 


图 像 旋转 之 后 也 可 以 根据 点 A(z,y) 求 解 原始 点 Ao (xo ,yo) 的 坐标 ,其 矩阵 表示 形 


Zo cosB —sing 0][z] 
"| sin8 cosB 中 (4-48) 
1 0 0 时 

图 像 旋转 之 后 ,由 于 数字 图 像 的 坐标 值 必须 是 整数 ,因此 ,可 能 引起 图 像 部 分 像素 点 的 
位 置 的 小 变化 ,因此 ,这 时 图 像 的 边缘 、 图 像 内 部 会 发 生 一 定 的 改变 ,从 严格 的 角度 分 析 , 由 
于 扩充 了 新 的 空白 像素 点 ,图 像 的 大 小 也 会 发 生 一 定 的 改变 。 但 一 般 情况 下 ,这 种 变化 可 能 


式 为 


加 
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感觉 不 明显 。 

例 4-7: 图 像 旋 转产 生 的 变化 

如 图 4-22 示例 了 图 像 旋转 所 产生 的 影响 。 原 图 像 经 过 了 两 次 45 和 135 旋转 变换 , 旋 
转 360" 之 后 ,图 4-22(b) 的 字迹 发 生 了 较 明 显 的 变化 ,特别 是 字体 的 边缘 产生 的 变化 更 为 


旋转 ”旋转 
变换 ”变换 


(a) 原始 图 像 (b) 旋转 以 后 的 图 像 
图 4-22 旋转 变换 产生 的 影响 


若 图 像 旋 转角 Bp 二 45° 时 , 则 变换 关系 为 
f 一 0.707zxo 十 0.707yo 


训 


(4-49) 
y =— 0.707zo 十 0.707yo 


以 原始 图 像 的 点 (1,1) 为 例 ,旋转 以 后 , 均 为 小 数 ,经 合 入 以 后 为 (1,0) ,产生 了 位 置 误差 。 因 
此 ,图 像 旋 转 以 后 可 能 会 发 生 一 些 细微 变化 。 

对 图 像 进 行 旋转 变换 时 应 注意 以 下 几 点 : 

(1) 为 了 避免 图 像 旋转 之 后 可 能 产生 的 信息 丢失 ,可 以 先进 行 平 移 ,然后 进行 图 像 
旋转 。 

(2) 图 像 旋转 之 后 ,可 能 会 出 现 一 些 空白 点 , 需 对 这 些 空白 点 进行 灰 度 级 的 插值 处 理 ， 
否则 影响 旋转 之 后 的 图 像 质 量 。 

在 某 些 情况 下 ,一 个 几何 变换 需要 两 个 独立 算法 支持 。 其 中 一 个 算法 来 实现 空间 变换 
本 身 , 用 它 描述 每 个 像素 点 如 何 从 其 初始 位 置 移动 到 目标 位 置 , 即 每 个 像素 点 的 几何 变换 ; 
而 另 一 个 算法 用 于 灰 度 级 的 插值 ,这 是 因为 经 过 变换 之 后 ,图 像 的 大 小 以 及 像素 的 坐标 可 能 
发 生变 化 ,因而 需要 进行 灰 度 级 插值 来 提高 图 像 质 量 , 反 之 亦 然 。 

需要 指出 的 是 ,上 述 所 讨论 的 旋转 是 绕 坐 标 轴 原点 (0,0) 进 行 的 ,如 果 图 像 旋转 是 绕 一 
个 其 他 指定 点 (a,5) 旋 转 , 则 先 要 将 坐标 系 平移 到 该 点 ,再 进行 旋转 ,然后 将 旋转 后 的 图 像 平 
移 回 原来 的 坐标 原点 。 


4.4.6 复合 变换 


图 像 的 复合 变换 是 指 对 给 定 图 像 进 行 两 次 或 两 次 以 上 的 平移 、 镜 像 . 比 例 、 旋 转 等 基本 
变换 的 多 次 变换 ,又 称 为 级 联 变换 。 由 于 引入 齐 次 坐标 后 图 像 的 基本 变换 采用 了 统一 的 矩 
阵 表示 形式 ,根据 矩阵 理论 可 知 ,对 给 定 图 像 按 顺序 连续 进行 多 次 基本 图 像 变换 ,其 变换 的 
矩阵 仍然 可 以 用 3X3 矩阵 表示 。 复 合 变换 的 矩阵 等 于 基本 变换 的 矩阵 按 变 换 顺序 依次 
相 乘 。 

车 对 图 像 依 次 进行 了 n 次 平移 、 镜 像 、 比 例 、 旋 转 等 基本 变换 ,其 变换 矩阵 分 别 为 T， 
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T,,…,T,, 则 nn 次 变换 之 后 的 复合 变换 矩阵 T 可 以 表示 为 
= (4-50) 

根据 复合 变换 的 组 合 类 型 ,复合 变换 可 以 分 为 如 下 两 类 。 

(1) 同类 型 复合 变换 。 复 合 变换 由 同一 种 基本 变换 组 成 , 即 相 同 的 基本 变换 连续 进行 
多 次 ,例如 ,复合 平移 、 复 合 比例 缩放 、 复 合 旋转 等 。 

(2) 不 同类 型 复合 变换 。 复 合 变换 由 不 同类 型 的 基本 变换 组 成 , 即 不 同 的 基本 变换 连 
续 进 行 多 次 ,例如 ,图 像 的 转 置 、 绕 任意 点 的 比例 缩放 、 绕 任意 点 的 旋转 等 。 

现 对 同类 型 的 复合 变换 讨论 如 下 。 

1. 复合 平移 

以 包含 两 次 基本 平移 的 复合 平移 为 例 , 指 将 图 像 先 平移 到 新 的 位 置 后 A; (zi ,yi) ,再 将 
图 像 平移 到 的 位 置 A (zs ,yz) ,复合 平移 矩阵 为 


1 0 Am fa 0 Ax;: 
T= TT,= 1 ~ 1 ~» 
a6 To @ 1 
Ll 0 AwT A 
一 |0 1 se | (4-51) 
0 0 ll 


观察 复合 变换 矩阵 工 可 以 发 现 ,两 次 平移 之 后 ,平移 的 距离 等 于 两 次 平移 距离 之 和 。 
因此 ,采用 章 次 坐标 表示 几何 变换 ,不 仅 形式 简洁 ,而 且 具 有 明显 的 几何 意义 。 两 次 以 上 的 
复合 平移 变换 可 由 此 类 推 。 

2. 复合 比例 缩放 

同样 ,以 包含 两 次 比例 缩放 变换 的 复合 缩放 变换 为 例 , 复 合 比例 矩阵 为 


a 0 01Ta 0 0 
T=TT=|0 bh "| 0 2 "| 
1 
Qia2 0 0 
-| 0 bb 0 (4-52) 
0 0 1 
对 图 像 连续 进行 多 次 比例 缩放 变换 ,最 后 的 复合 变换 矩阵 只 需要 对 两 次 变换 的 比例 常 
数 进行 乘积 运算 即 可 。 
3. 复合 旋转 


类 似 地 ,对 图 像 连续 进行 多 次 旋转 变换 ,最 后 合成 的 旋转 变换 矩阵 等 于 各 次 旋转 角度 之 
和 。 以 包含 两 次 旋转 变换 的 复合 旋转 变换 为 例 , 其 最 后 的 变换 矩阵 为 


cosB， sinB OF cosB sin& 0 
T= TT= |— sinp cosh "| —sinB, cosB "| 
0 0 1 0 0 a 


—sin(B 十 Be) cos(B 二 TB) 0 (4-53) 


cos(B 二 +B) sin(B 二 +pB) | 
0 0 1 
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以 上 均 为 相对 于 原点 (图 像 中 心 ) 进 行 比例 、 旋 转 等 复合 变换 ,如 果 要 相对 其 他 参考 点 进 
行 以 上 变换 , 则 要 先进 行 平移 ,然后 再 进行 其 他 基本 变换 ,最 后 形成 图 像 的 复合 变换 。 不 同 
的 复合 变换 ,所 包含 的 基本 变换 的 数量 和 次 序 各 不 相同 ,但 是 无 论 其 变换 过 程 多 么 复杂 ,都 
可 以 分 解 成 若干 基本 变换 ,都 可 以 采用 齐 次 坐标 表示 , 且 图 像 复 合 变换 矩阵 由 一 系列 基本 变 
换 矩 阵 依次 相 乘 而 得 到 。 


4.4.7 控制 点 变换 

控制 点 变换 是 通过 测定 若干 特定 坐标 点 的 位 移 量 来 确定 坐标 变换 方程 的 系数 的 方法 。 
如 图 4-23 所 示 , 若 已 知 输入 图 像 的 1.2、3、4 四 个 点 与 输出 图 像 上 A、B、C、D 四 个 点 对 应 
( 即 具有 四 个 控制 点 对 的 位 置 对 应 关系 ), 则 可 以 根据 这 四 对 已 知 控制 点 对 ,通过 如 下 代数 变 
换 方程 确定 几何 变换 关系 。 


并 一 aro 十 byo 十 czoyo 十 好 
| (4-54) 


y=eroT fyot BroNm 十 天 


输入 图 像 输出 图 像 


图 4-23 控制 点 位 置 映射 关系 


求解 上 述 变换 方程 中 的 系数 ,就 可 以 得 到 满足 要 求 的 近似 变换 关系 , 即 可 确定 所 有 落 入 
矩形 框 内 的 输出 点 。 实 际 上 ,上 述 变换 可 以 表示 为 更 一 般 的 代数 血 函 数 方程 变换 形式 : 


NN-1 


工 二 bp Dasziys 

村 (4-55) 
y= 2) 2 6aiW 

1=0 j=0 


若 N 取 值 增 大 ,为 确定 变换 系数 所 需 的 对 应 控制 点 对 数量 就 增多 ,变换 精度 就 越 高 。 
多 数 情况 下 ,N 取 值 在 2 一 3 之 间 即 可 满足 精度 要 求 。 控 制 点 变换 关系 常用 于 几何 畸变 的 
校正 。 

4.4.8 透视 变换 


在 光线 的 照射 下 ,三 维 物 体 可 以 在 二 维 平 面 上 形成 投影 ,这 种 将 三 维 物体 或 对 象 转变 为 
二 维 图 形 表 示 的 过 程 称 为 投影 变换 ,投影 中 心 称 为 视点 。 根 据 视 点 与 投影 平面 之 间距 离 的 
不 同 ,投影 可 分 为 平行 投影 和 透视 投影 。 平 行 投影 的 视点 与 投影 平面 之 间 的 距离 为 无 穷 大 ， 
车 该 距离 是 有 限 的 则 称 为 透视 投影 (变换 )。 

透视 投影 即 透视 变换 ,透视 投影 的 距离 决定 着 透视 投影 的 透视 缩小 效应 ,三 维 物 体 
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或 对 象 透视 投影 的 大 小 与 物体 到 视点 的 距离 成 反比 。 例 如 ,平行 于 投影 面 且 长 度 相 等 的 
两 段 直线 , 离 投 影 中心 距 离 较 近 的 线段 ,其 透视 投影 长 , 离 投 影 中心 远 的 线段 ,其 透视 投 
影 短 。 这 种 效应 所 产生 的 视觉 效果 与 照相 机 系统 和 人 的 视觉 系统 十 分 类 似 。 与 平行 投 
影 相 比 ,透视 投影 的 深度 感 更 强 ,看 上 去 更 真实 ,但 透视 投影 不 能 真实 地 反映 物体 的 精确 
尺寸 和 形状 。 

透视 投影 时 ,平行 于 投影 面 的 平行 线 的 投影 依然 平行 ,而 不 平行 于 投影 面 的 平行 线 的 投 
影 则 会 聚集 到 一 个 点 ,这 个 点 称 为 灭 点 (vanishing point) 。 灭 点 可 以 看 作 是 无 限 远 处 的 一 
点 在 投影 面 上 的 投影 。 透 视 投 影 的 灭 点 可 以 有 无 限 多 个 ,不 同方 向 的 平行 线 在 投影 面 上 就 
可 以 形成 不 同 的 灭 点 ,其 中 坐标 轴 方 向 的 平行 线 在 投影 面 上 所 形成 的 灭 点 称 为 主 灭 点 。 对 
于 三 维 空间 (zyx 三 个 坐标 轴 ) 主 灭 点 最 多 有 3 个 。 透 视 投影 一 般 根据 主 灭 点 的 数量 ( 即 按 
投影 面 与 坐标 轴 的 夹 角 ) 进 行 分 类 ,因此 可 分 为 一 点 透视 、 二 点 透视 和 三 点 透视 ,如 图 4-24 
所 示 。 


灭 点 
(a) 一 点 透视 (b) 二 点 透视 (6) 三 点 透视 


图 4-24 透视 变换 的 类 型 


以 一 点 透视 为 例 , 如 图 4-24(a) 所 示 , 它 仅 有 一 个 主 灭 点 , 即 投影 面 与 一 个 坐标 轴 正 交 ， 
与 另外 两 个 坐标 轴 平 行 。 进 行 一 点 透视 投影 变换 时 ,应 很 好 地 考虑 投影 的 布局 ,以 避免 三 维 
形体 或 对 象 的 平面 域 积聚 成 直线 或 直线 积聚 成 点 而 影响 直观 性 。 主 要 考虑 如 下 几 点 ， 

(1) 三 维 物体 或 对 象 与 画面 (投影 面 ) 的 相对 位 置 。 

(2) 视 距 , 即 视点 与 画面 的 距离 。 

(3) 视点 的 高 度 。 

如 图 4-25 所 示 , 设 视点 在 坐标 原点 ,x 坐标 轴 x 
方向 与 观察 方向 重合 一 致 ,点 P(z,y,z) 为 三 维 形体 
或 对 象 上 的 一 点 ,经 一 点 透视 变换 后 在 投影 面 (观察 
平面 )UOV 上 的 对 应 点 为 PCz',y ,x ) ,投影 面 与 视 
点 的 距离 为 d ,并 与 > 轴 垂 直 ,z 轴 过 投影 面 窗口 的 
中 心 , 窗 口 是 边 长 为 2a 的 正方 形 ,根据 几何 学 知识 


P(x, y, 2) 


U 
可 得 i > 
zy 的 投影 平面 
人 (4-56) 图 4-25 一 点 透视 变换 原理 
z=d 
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利用 齐 次 坐标 ,与 二 维 几 何 变换 类 似 , 将 该 过 程 写 成 变换 矩阵 形式 为 
x 0 01Tz 
0 0lly 
k 0||z 
"Ei 
这 就 是 图 像 的 透视 变换 一 一 一 点 透视 变换 , 即 
[zx y x = [za 2d d 1] 
实际 上 ,更 一 般 情况 的 一 点 透视 变换 矩阵 也 可 以 用 一 个 4X4 的 矩阵 表示 。 
4.4.9 其 他 变换 


如 前 所 述 , 齐 次 坐标 为 表示 各 种 基本 变换 及 其 复合 变换 提供 了 一 个 简单 有 效 的 方法 。 
然而 ,在 许多 图 像 处 理 与 分 析 的 具体 应 用 中 ,所 需 的 几何 变换 都 相当 复杂 ,甚至 有 些 无 法 
简便 的 数学 式 来 表达 。 这 时 几何 变换 常常 要 通过 对 实际 图 像 进行 测量 才 可 获得 ,因此 ,也 可 
以 采用 测量 结果 而 不 是 函数 形式 描述 几何 变换 。 例 如 ,在 对 由 摄像 机 拍摄 的 具有 几何 畸变 
的 图 像 进行 几何 校正 时 ,首先 应 将 一 个 矩形 栅 格 目标 数字 化 并 显示 出 来 。 因 为 摄像 机 有 几 
何 变形 ,所 显示 的 图 案 不 一 定 是 准确 的 矩形 ,因此 所 求 几何 变换 应 能 使 其 机 格 图 案 再 次 被 复 
原 为 准确 的 矩形 ,从 而 修正 摄像 机 所 产生 的 畸变 。 一 般 而 言 , 采 用 同样 的 几何 变换 可 用 于 校 
正 同一 摄像 机 产生 的 几何 畸变 。 

图 像 几何 变换 的 一 个 重要 应 用 是 消除 由 于 摄像 机 导致 的 数字 图 像 的 几何 畸变 。 当 需要 
从 数字 图 像 中 得 到 定量 的 空间 测量 数据 时 ,几何 校正 被 证 明 是 十 分 重要 和 有 效 的 ,特别 是 对 
于 从 卫星 遥感 图 像 或 飞机 上 通过 侧 视 雷 达 所 得 到 的 图 像 , 一 般 均 产 生 了 比较 严重 的 几何 畸 
变 。 因 此 ,这 些 图 像 都 需要 先 经 过 几何 校正 ,然后 才能 对 其 内 容 做 出 解释 。 

几何 校正 是 遥感 图 像 预 处 理 中 必须 解决 的 问题 ,遥感 影像 的 几何 畸变 分 为 内 部 畸变 和 
外 部 畸变 。 内 部 畸变 是 由 于 传感器 内 在 的 因素 所 引起 的 畸变 ,如 镜头 的 像 差 比例 尺 变 化 、 
牌 斜 ,中心 移 动 .扫描 非 线性 、 辐 射 状 畸变 和 扭曲 等 。 外 部 畸变 是 由 于 运载 工具 的 姿态 和 目 
标 引 起 的 畸变 ,包括 飞行 器 飞行 高 度 变 化 引起 的 比例 尺 误 差 , 由 于 飞行 器 的 俯仰 ` 滚 摆 及 偏 
航 所 引起 的 畸变 ,地 形 起 伏 的 畸变 ,地 球 曲率 引起 的 畸变 等 。 

总 之 ,遥感 仪器 在 获取 地 球 表面 信息 的 过 程 中 ,受到 各 种 内 部 的 和 外 部 的 干扰 ,使 所 获 
得 的 图 像 包含 着 各 种 辐射 畸变 和 几何 畸变 。 无 论 对 于 航空 遥感 还 是 卫星 遥感 ,这 些 畸 变 和 
误差 都 必须 予以 纠正 。 对 于 仪器 内 在 因素 而 导致 的 误差 ,可 根据 预先 测试 的 标定 数据 进行 
校正 。 有 时 这 种 标定 数据 还 需要 进行 修正 ,以 适应 仪器 在 长 期 运行 中 可 能 产生 的 漂移 和 变 
化 。 外 部 畸变 的 校正 , 则 应 根据 不 同 的 情况 进行 处 理 。 

对 于 琐 感 图 像 的 几何 畸变 ,可 以 利用 地 面 控制 点 方法 进行 几何 校正 , 即 利 用 地 面 上 的 水 
陆 交叉 点 ,公路 交叉 点 ,河流 水 域 分 义 点 等 具有 明显 特征 的 地 点 ,以 及 这 些 特 征 点 的 已 知 位 
置 或 地 面 高 度 等 参数 ,并 通过 这 些 控 制 点 的 对 应 关系 进行 几何 校正 。 例 如 ,对 于 陆地 卫星 图 
像 的 几何 校正 ,可 以 通过 适当 数量 (N 点 ) 的 地 面 控制 点 , 按 如 下 关系 进行 几何 畸变 校正 。 


Wi 一 ao 十 aiz 十 azy 十 asz2 十 aizy 十 asy 


k 0 

0 k 
一 (4-57) 

0 0 

0 0 


i=1,2,3,.…,N—1 (4-58) 


Vi = bo 二 hz 二 byt br hry tbsy: 
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式 中 , (u,v) 是 校正 前 原始 图 像 控 制 点 的 坐标 ,(z,y) 是 校正 后 目标 图 像 对 应 点 的 坐标 , 令 


Wi be 
Us vz 
== | v= 
Lun UN 
[a bi 
as bs 
a= b=|. 
Las bs 
2 9 2 
1 Bi i 区 


1 TX2 yz ZX2 ZIZzyz 组 


1 xzN yn Zh ZNyN DA 
当 对 应 的 控制 点 数 多 于 6 个 时 ,将 产生 过 约 东 ,以 均 方 误差 最 小 求解 a 和 5b, 今 
E=(u—Aa)'(u—Aa)+(v—Ab)'(v— Ab) 
根据 最 小 二 乘 方 法 ,可 得 


a= (A'A) A™h 
b= ATA) "ATY 
可 以 根据 校正 精度 的 要 求 选择 变换 多 项 式 。 一 般 情况 下 ,三 次 以 下 多 项 式 可 以 满足 陆 
地 卫星 图 像 的 几何 畸变 校正 要 求 。 此 外 ,还 有 一 些 图 像 系 统 采用 诸如 极 坐标 、 柱 坐标 、 球 面 
坐标 等 非 矩形 的 像素 坐标 ,用 普通 图 像 显示 设备 观察 这 些 图 像 时 ,也 需 先 对 图 像 进行 校正 ， 
即 应 将 图 像 转换 为 矩形 像素 坐标 。 例 如 ,在 油井 套 管 缺陷 识别 中 ,有 时 需要 将 极 坐标 系 中 的 
内 罕 镜 图 像 转换 为 直角 坐标 系 中 的 图 像 ,然后 进行 分 析 与 处 理 。 
几何 变换 的 另 一 个 应 用 是 对 相似 的 图 像 进行 配 准 ,以 便 进 行 图 像 比 较 , 典 型 的 应 用 是 利 
用 图 像 相 减 来 检测 运动 或 变化 。 有 时 ,为 便于 解释 需 将 图 像 以 另 一 种 样式 表示 ,这 时 也 会 用 
到 几何 变换 ,地 图 绘制 中 的 图 像 投影 也 会 用 到 几何 变换 。 例 如 ,在 利用 从 宇宙 飞船 传 回来 的 
图 像 拼 成 地 球 、 月 球 及 行星 的 航拍 镶嵌 地 图 时 就 需 应 用 几何 变换 。 


4.5 灰 度 级 插值 


在 进行 图 像 的 比例 缩放 、 图 像 的 旋转 及 其 复合 变换 时 ,原始 图 像 的 像素 坐标 (z,y) 为 整 
数 ,而 变换 后 目标 图 像 的 位 置 坐标 并 非 整数 , 反 过 来 也 是 如 此 。 因 此 ,在 进行 图 像 的 几何 变 
换 时 ,除了 要 进行 几何 变换 运算 之 外 ,还 需要 进行 灰 度 级 插值 处 理 。 常 用 的 灰 度 插值 方法 有 
三 种 一 一 最 近邻 法 、 双 线性 插值 法 和 三 次 内 插 法 。 


4.5.1 最 近邻 法 


最 近邻 法 是 一 种 简单 的 插值 方法 ,如 图 4-26 所 示 , 它 是 通过 计算 与 点 P(xzo yo) 临近 的 
四 个 点 ,并 将 与 点 PCzo,yo) 最 近 的 整数 坐标 点 (zyy) 的 灰 度 值 取 为 PCzo,yo) 点 灰 度 近似 
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值 。 在 PCzo,yo) 点 各 相 邻 像素 间 灰 度 变化 较 小 时 ,这 种 方法 是 一 种 简单 快速 的 方法 ,但 当 
PCzo,yo) 点 相 邻 像素 间 灰 度 值 差异 很 大 时 ,这 种 灰 度 估 值 方法 会 产生 较 大 的 误差 ,甚至 可 
能 影响 图 像 质量 。 


图 4-26 最 近邻 法 插值 示意 图 


4.5.2 双 线 性 插值 法 


双 线性 插值 法 是 对 最 近邻 法 的 一 种 改进 , 即 用 线性 内 插 方法 ,根据 点 PCzo,xyo) 的 四 个 
相 邻 点 的 灰 度 值 ,通过 两 次 插值 计算 出 灰 度 值 f(zo ,yo) ,如 图 4-27 所 示 。 


f(x+1,y+1) 


J 


2 


灰 度 值 


图 4-27 双 线 性 插值 


具体 计算 过 程 如 下 : 
(1) 计算 a 和 8B。 
a= Xo0o—xX 


(4-59) 
B=y—y 


(2) 根据 /(z,y) 和 f(z 十 1,y) 插 值 求 / (xo,y)。 
f(z033) = f(z3y) taLf (zt+1,y) — fz,y)] 
(3) 根据 f(x,y 十 1) 和 f(z 十 1,y 十 1) 插 值 求 f(zxo,y 十 1)。 
fzorytl) = /frytl)+aLf(zt+lyt+lD)— /ryt+1)] 
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(4) 根据 f(xo,y) 和 FCzo,y 十 1) 插 值 求 FCzo,yo)。 
fxs%)= fro Eo y+1) — fzos3)] 
= (1—o) (Pf(rsy) ta(ll—Pf(zrt+1,y)+ 
(1—DBf(ry+ DB/ (zt15+1) 
= f(z39) Talf (tl — f+BAF s+ 1 — fz)j+ 
mLF(z 十 1,y 十 1) 十 FGz,y) 一 Fzy 十 1D) 一 FGz 十 1,y)] (4-60) 
式 中 ,z==[zxo],y==[yoj 
双 线 性 灰 度 插值 计算 方法 由 于 已 经 考虑 到 了 点 P(zo ,yo) 的 直接 邻 点 对 它 的 影响 ,因此 
一 般 可 以 得 到 令 人 满意 的 插值 效果 。 但 这 种 方法 具有 低 通 滤波 性 质 , 使 高 频 分 量 受 到 损失 ， 
使 图 像 细 节 退 化 而 变 得 轮廓 模糊 。 在 某 些 应 用 中 , 双 线 性 灰 度 插值 的 斜率 不 连续 还 可 能 会 
产生 一 些 不 期 望 的 结果 。 


4.5.3 三 次 内 插 法 


为 得 到 更 精确 的 PCzo ,yo) 点 的 灰 度 值 ,在 更 高 程度 上 保证 几何 变换 后 的 图 像 质 量 , 实 
现 更 精确 的 灰 度 插值 效果 ,可 采用 三 次 内 插 法 等 更 高 阶 插值 法 ,如 三 次 样 条 函数 、Legendre 
中 心 函数 和 sin(xz)/(xz) 函 数 等 ,这 时 既 要 考虑 P(zo ,yo) 点 的 直接 邻 点 对 它 的 影响 ,还 应 
考虑 到 该 点 周围 16 个 邻 点 的 灰 度 值 对 它 的 影响 。 

根据 连续 信号 采样 定理 可 知 , 若 对 采样 值 
用 插值 函数 *(z)=sin(xz)/(Crz) 进 行 插值 , 当 
采样 频率 不 低 于 信号 谱 最 高 频率 的 两 倍 时 可 
以 准确 地 恢复 原 信号 ,并 可 准确 地 得 到 采样 点 
间 任 意 点 的 值 。 插 值 函 数 sin(xz)/(xz) 特 性 之 7 0 i i 
如 图 4-28 所 示 。 


5(z) 一 CE 可 以 采用 以 下 三 次 多 项 式 


s(x) 


图 4-28 插值 函数 sin(xz)/(rz) 特 性 


近似 。 
1—2|z|:+|zl: hw 
s(z)= 4—8|z|+5|zl:—|Izl’ 2>|zl21 (4-61) 
0 Iz| 宇 2 


采用 Samezz > 插值 机 数 ,可 采用 下 述 步骤 插值 算出 /(zuvo)， 
C0) 计算 s(1 上 a)ss(a) ss(l—0) v5(2— a CL ssl Bs(2 Ps 
(2) 根据 f(z 一 1,y) ,f(x,y) ;f(z 十 1,y) ,f(z 十 2,y) 计 算 f(zxosy)。 
(msy) =s(1l4Faf (r= 1 和 safle —=o)f(r lw 证 
s(2—a)f(zt+2,y) 

(3) 按 步 骤 (2) 求 f(zosy 一 1) ,f(zosy 十 1) ,f(zo sy 十 2)。 
(4) 根据 f(zxo,y 一 1) ,f(zosyy) ,f(zosy 十 1) ,f(xzo sy 十 2) 计 算 f(zxo ,yo)。 

Jrzoyyo) 一 5(1 十 B)FCzoyy 一 1) 十 SC)FCzoyy) 十 s(1 一 B)FCzoyy 十 1) 十 
a(2 — A nosy +2 (4-62) 
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上 述 计算 过 程 可 用 矩阵 表示 为 
fxo»y0) = ABC (4-63) 
式 中 
A=[s(1+a) s(a) s(1—a) s(2—a)] 
= 
tzsy = flzsy) zy 十 1) fxsyt+2) 
be 
feby—BD Fi fit Fi 赴 23 各 
C=[s(1+pB) s(p) s(1—B) 52 一 用 了 
从 函数 拟 合 的 角度 分 析 , 三 次 内 插 方 法 的 插值 点 连 线 可 以 实现 光滑 过 渡 ,插值 后 的 图 像 
灰 度 一 致 性 较 好 ,三 种 插值 方法 中 ,该 方法 的 插值 效果 最 好 ,不 足 之 处 是 计算 量 增加 较 多 ,而 
且 对 于 图 像 中 细节 较 多 的 部 分 ,三 次 插值 具有 低 通 滤波 的 作用 。 


县 :一 


习题 


1. 数字 图 像 处 理 算法 按 功 能 分 为 哪 几 种 ? 

2. 根据 图 像 处 理 算 法 的 特点 ,图 像 在 空间 域 上 的 处 理 运算 可 以 分 为 哪 几 种 类 型 ? 各 有 
何 特点 ? 

3. 点 运算 有 哪些 主要 应 用 领域 ?为 什么 数字 图 像 的 点 运算 不 会 改变 图 像 内 各 像素 的 
空间 位 置 关系 ? 

4. 为 什么 点 运算 又 称 为 灰 度 变换 ? 灰 度 变换 可 以 改变 图 像 的 对 比 度 吗 ? 为 什么 ? 

5. 采用 灰 度 变换 能 减弱 对 比 度 吗 ? 应 如 何 进行 运算 ? 

6. 找 一 幅 图 像 ,编写 MATLAB 程序 实现 如 下 线性 点 运算 : 

Be 一 aD4A 十 0 

其 中 a=1.2,5==18, 分 析 运 算 结果 。 

7. 简 述 图 像 的 点 运算 具有 哪些 典型 应 用 。 

8. 图 像 的 负片 是 怎么 形成 的 ? 应 用 MATLAB 在 灰 度 变换 程序 中 具体 形成 图 像 负片 。 

9. 根据 代数 运算 的 特点 ,分析 并 举例 说 明代 数 运算 具有 哪些 典型 应 用 。 

10. 为 什么 梯度 图 像 可 以 突出 表现 轮廓 ? 

11. 试 编写 MATLAB 程序 实现 两 幅 数字 图 像 的 相 加 与 相 减 运算 。 

12. 几何 运算 在 数字 图 像 处 理 技术 中 具有 哪些 典型 应 用 ? 

13. 试 阐述 为 什么 2X2 的 变换 矩阵 了 不 能 直接 实现 二 维 图 像 的 平移 变换 。 

14. 常用 的 几何 运算 有 哪 几 种 ? 几何 运算 在 数字 图 像 处 理 技术 中 具有 哪些 典型 应 用 ? 

15. 什么 是 齐 次 坐标 ? 在 图 像 的 几何 变换 中 它 具 有 哪些 优点 ? 

16. 在 图 像 放 大 变换 中 ,为 什么 图 像 的 放大 倍数 太 大 时 会 产生 马赛 克 现 象 ? 有 哪些 方 
法 可 以 解决 这 个 问题 ? 

17. 编写 程序 实现 图 像 的 镜像 变换 。 

18. 图 像 的 镜像 变换 包括 几 种 情况 ? 各 有 何 特点 ? 
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19. 编写 MATLAB 程序 实现 图 像 按 任意 角度 的 旋转 变换 ,并 分 析 以 下 问题 : 
(1) 根据 图 像 旋转 变换 公式 ,旋转 变换 对 图 像 的 质量 有 无 影响 ? 

(2) 若 & 取 正 整 数 ,观察 图 像 旋 转 &X90 X45 "时 ,会 发 生 什么 不 同 的 现象 。 
20. 什么 是 图 像 的 复合 变换 ? 复合 变换 可 以 分 为 几 种 情况 ? 

21. 试 简 述 如 何 应 用 控制 点 法 进行 图 像 的 几何 校正 。 

22. 根据 双 线 性 插值 原理 ,分 析 为 何 双 线性 插值 具有 低 通 滤波 作用 。 


So 图 像 空域 增强 


CHAPTER 5 


图 像 在 获取 、 传 输 、 使 用 过 程 中 ,可 能 会 产生 噪声 或 使 图 像 质量 降低 ,图 像 增 强 即 有 针对 
性 地 消除 和 抑制 图 像 噪声 .提高 图 像 质量 。 简 而 言 之 ,图 像 增强 是 根据 应 用 需要 突出 图 像 中 
的 某 些 “有 用 ?信息 ,削弱 或 去 除 不 需要 的 信息 ,以 扩大 图 像 中 不 同 物 体 特征 之 间 的 差别 。 处 
理 的 目的 是 使 处 理 后 的 图 像 对 于 特定 应 用 而 言 , 比 原始 图 像 更 合适 ,或 者 使 图 像 特征 信息 提 
取 更 方便 ,为 进一步 对 图 像 进 行 分 析 葛 定 基础 。 由 于 具体 应 用 的 目的 和 要 求 不 同 ,因而 “有 
用 ”的 含义 和 标准 也 不 尽 相同 。 一 般 情况 下 ,经 过 增强 处 理 后 ,图 像 的 视觉 效果 会 发 生变 化 ， 
这 种 变化 意味 着 某 些 特定 信息 得 到 了 增强 ,或 者 图 像 的 视觉 效果 得 到 了 改善 。 

图 像 增强 在 航空 航天 、 工 业 自动 化 生产 、 生 物 医学 、 社 会 公共 事务 管理 等 方面 得 到 了 广 
泛 的 应 用 。 比 如 机 械 零 部 件 的 检查 和 识别 .印刷 电路 板 的 检查 、 食 品 包装 出 厂 前 的 质量 检 
查 、X 射线 成 像 工 件 尺寸 测量 、 集 成 芯片 内 部 电路 缺陷 检测 等 。 需 要 注意 的 是 ,图 像 增 强 算 
法 并 不 能 增加 原始 图 像 的 信息 ,而 是 通过 某 种 技术 手段 有 选择 地 突出 对 某 一 具体 应 用 有 价 
值 的 信息 。 即 图 像 增 强 只 通过 突出 某 些 信息 以 增强 对 这 些 信 息 的 辨识 能 力 ,而 其 他 信息 则 
被 压缩 。 也 就 是 说 ,图 像 的 增强 处 理 并 不 是 一 种 无 损 处 理 。 例 如 ,图 像 平滑 处 理 算法 中 经 常 
采用 低 通 滤波 法 ,虽然 消除 了 图 像 的 噪声 ,但 图 像 的 空间 纹理 特征 却 被 削弱 ,图 像 从 整体 上 
显得 比较 模糊 。 因 此 ,图 像 噪声 的 消除 是 以 纹理 信息 (高 频 信 息 ) 的 减弱 为 代价 而 实现 的 。 
本 章 围绕 图 像 增强 技术 的 原理 与 方法 ,首先 介绍 数字 图 像 噪声 及 其 产生 的 原因 、 图 像 增 强 处 
理 方法 分 类 ,然后 介绍 图 像 直 方 图 增强 法 .代数 增强 法 ` 空 域 线性 平滑 滤波 空域 非 线性 滤波 
和 锐 化 滤波 等 增强 方法 。 


5.1 图 像 噪声 


对 于 数字 图 像 处 理 而 言 ,噪声 是 指 图 像 中 的 非 本 源 信 息 。 图 像 中 各 种 妨碍 人 们 对 其 信 
息 接受 的 因素 即 可 称 为 图 像 噪声 。 在 理论 上 ,噪声 可 以 定义 为 不 可 预测 ,只 能 用 概率 统计 方 
法 来 认识 的 随机 误差 。 因 此 ,噪声 会 影响 人 的 感官 对 所 接收 的 源 信 息 的 准确 理解 。 在 理论 
上 ,噪声 只 能 通过 概率 统计 的 方法 来 认识 和 研究 。 从 一 般 情 况 分 析 , 图 像 噪声 可 认为 是 多 维 
随机 信号 ,可 以 采用 概率 分 布 函数 ,概率 密 度 函数 ,以 及 均值 ,方差 ,相关 函数 等 对 噪声 进行 
描述 和 分 析 。 


120 本 | 数字 图 像 处 理 及 应 用 一 一 使 用 MATLAB 分 析 与 实现 


5.1.1 图 像 品 声 的 产生 


目前 ,大 多 数 数字 图 像 系统 中 ,输入 图 像 都 是 通过 扫描 方式 将 多 维 图 像 变 成 一 维 电 信 
号 ,再 对 其 进行 存储 、 处 理 和 传输 等 ,最 后 形成 多 维 图 像 信 号 。 这 一 系列 复杂 过 程 中 ,图 像 数 
字 化 设备 .电气 系统 和 外 界 影响 将 使 得 图 像 品 声 的 产生 不 可 避免 。 例 如 ,处 理 高 放大 倍数 遥 
感 图 片 的 X 射线 图 像 系统 中 的 噪声 去 除 等 已 成 为 不 可 或 缺 的 技术 。 


5.1.2 图 像 噪声 的 分 类 


图 像 噪声 按 其 产生 的 原因 可 分 为 外 部 噪声 和 内 部 噪声 。 外 部 噪声 指 系统 外 部 干扰 以 电 
磁 波 或 经 电源 串 进 系统 内 部 而 引起 的 噪声 ,如 电气 设备 、 天 体 放电 现象 等 引起 的 噪声 。 内 部 
噪声 指 成 像 系统 本 身 原 因 引起 的 噪声 。 一 般 情 况 下 ,数字 图 像 中 常见 的 内 部 干扰 主要 包括 
如 下 几 种 ， 

(1) 由 光 和 电 的 基本 性 质 所 引起 的 噪声 。 如 电流 的 产生 是 因 电子 或 空 穴 粒 子 的 集合 和 
定向 运动 而 形成 , 因 这 些 粒子 的 随机 性 运动 会 产生 散 粒 噪声 ; 而 导体 中 自由 电子 的 无 规则 
热 运 动 会 产生 热 噪声 ; 根据 光 的 粒子 性 ,图 像 是 由 光量 子 所 传输 ,而 光量 子 密度 随时 间 和 空 
间 变 化 也 可 形成 光量 子 噪声 等 。 

(2) 设备 元 器 件 及 材料 本 身 引 起 的 噪声 ,如 磁带 、 磁 盘 表 面 缺 陷 所 产生 的 噪声 。 

(3) 系统 内 部 设备 电路 所 引起 的 噪声 ,包括 电源 系统 引入 的 交流 噪声 、 偏 转 系统 和 钳 位 
电路 引起 的 噪声 等 。 

(4) 电器 部 件 机 械 运 动产 生 的 噪声 ,如 数字 化 设备 的 各 种 接头 因 抖动 引起 的 电流 变化 
所 产生 的 噪声 ,磁头 、 磁 带 抖 动 引起 的 抖动 噪声 等 。 
要 指出 的 是 ,噪声 分 类 并 不 是 绝对 的 , 按 不 同 的 性 质 有 不 同 的 分 类 方法 。 例 如 ,依据 
统计 特征 ,图 像 噪声 可 分 为 平稳 噪声 和 非 平稳 噪声 两 种 ,其 中 统计 特性 不 随时 间 变 化 的 噪声 
称 为 平稳 噪声 ,统计 特性 随时 间 变 化 的 噪声 称 为 非 平稳 噪声 。 根 据 噪声 与 信号 之 间 的 关系 ， 
可 分 为 加 性 噪声 和 乘 性 噪声 。 加 性 随机 噪声 方法 成 熟 ,而 乘 性 随机 噪声 处 理 方法 目前 还 没 
有 成 熟 和 通用 的 处 理 方法 。 按 噪声 频谱 分 类 ,又 可 以 分 为 白 噪 声 1/ 噪声 和 三 角 噪 声 。 频 
谱 均 匀 分 布 的 噪声 称 为 白 噪 声 ; 频谱 与 频率 成 反比 的 称 为 1/ 了 噪声; 而 与 频率 平方 成 正比 
的 称 为 三 角 噪 声 等 。 


5.1.3 图 像 噪声 的 特点 


如 图 5-1 所 示 是 一 幅 含 有 噪声 的 图 像 。 一 般 情况 下 ， 
图 像 中 的 噪声 有 以 下 三 个 特点 。 
1. 随机 性 
由 于 噪声 在 图 像 中 是 随机 出 现 的 ,所 以 其 分 布 和 大 小 
是 随机 的 ,对 于 噪声 的 处 理 , 需 根据 具体 噪声 的 特点 ,采用 
概率 统计 方法 进行 分 析 和 处 理 。 

2. 又 加 性 

根据 噪声 与 信号 之 间 的 关系 ,噪声 包括 加 性 噪声 和 乘 
性 噪声 。 理 论 上 ,加 性 随机 噪声 方法 成 熟 , 且 处 理 比较 方 


图 5-1 含有 噪声 的 图 像 


到 
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便 ; 而 乘 性 随机 噪声 处 理 方法 目前 还 没有 成 熟 的 理论 ,并 且 处 理 起 来 非常 复杂 。 一 般 条 件 
下 ,现实 生活 中 所 遇 到 的 绝 大 多 数 图 像 噪声 均 可 以 认为 是 加 性 噪声 。 在 图 像 的 串联 传输 系 
统 中 ,各 个 串联 部 件 引 起 的 噪声 一 般 具 有 全 加 效应 ,导致 信 品 比 下降 。 

3. 噪声 与 图 像 之 间 具 有 相关 性 

通常 情况 下 ,摄像 机 的 信号 和 噪声 相关 ,明亮 部 分 噪声 小 ,黑暗 部 分 噪声 大 。 数 字 图 像 
处 理 技术 中 存在 的 量化 噪声 与 图 像 相位 相关 。 例 如 ,图 像 内 容 接近 平坦 时 ,量化 噪声 呈现 伪 
轮廓 ,但 此 时 图 像 信 号 中 的 随机 噪声 会 因为 颤 噪 效 应 反而 使 量化 噪声 变 得 不 很 明显 。 

改善 被 噪声 污染 的 图 像 质量 有 两 种 方法 : 一 是 不 考虑 图 像 噪声 的 原因 ,只 对 图 像 中 某 
些 部 分 加 以 处 理 或 突出 有 用 的 图 像 特 征 信 息 , 改 善后 的 图 像 并 不 一 定 与 原 图 像 信息 完全 一 
致 。 这 一 类 改善 图 像 特 征 的 方法 就 是 图 像 增强 技术 ,主要 目的 是 要 提高 图 像 的 可 辨识 性 。 
另 一 类 方法 是 针对 图 像 产生 噪声 的 具体 原因 ,采取 技术 方法 补偿 噪声 影响 ,使 改善 后 的 图 像 
尽 可 能 地 接近 原始 图 像 。 这 类 方法 称 为 图 像 恢 复 或 图 像 复原 技术 。 


5.2 图 像 增 强 处 理 分 


图 像 增强 处 理 方法 根据 处 理 过 程 所 在 的 空间 不 同 , 可 分 为 基于 空间 域 的 增强 方法 和 基 
于 频率 域 的 增强 方法 两 大 类 ,如 图 5-2 所 示 。 
按 比例 线性 拉 伸 


直接 灰 度 变换 分 段 线性 拉 伸 
对 数 拉 伸 
非 线性 变换 | 数 拉 伸 


其 他 非 线性 拉 伸 


灰 度 变换 直方 图 均衡 化 
ism | 
直方 图 规定 化 
空域 增强 图 像 代数 运算 
邻 城 平均 法 
we { 
空域 江波 中 值 江波 
图 像 增强 梯度 法 
锐 化 江波 { 拉 普 拉 斯 算 子 法 
定向 滤波 
低 通过 波 
oo | se 
带 通 江波 
带 阻 滤波 


5-2 图像 增强 方法 类 型 
此 外 ,图 像 增 强 技 术 按 所 处 理 对 象 的 不 同 还 可 分 为 灰 度 图 像 增 强 和 彩色 图 像 增强 ; 按 


增强 的 目的 还 可 分 为 光谱 信息 增强 .空间 纹理 信息 增强 和 时 间 信 息 增强 。 通 常情 况 下 ,如果 
没有 特别 说 明 ,一 般 均 指 对 灰 度 图 像 的 增强 。 
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5.2.1 空域 增强 法 


基于 空域 的 增强 方法 直接 在 图 像 所 在 的 二 维 空间 进行 处 理 , 即 直接 对 每 一 像素 点 的 灰 
度 值 进行 处 理 。 根 据 所 采用 的 技术 不 同 又 可 分 为 灰 度 变换 和 空域 滤波 两 类 方法 。 

灰 度 变换 是 基于 点 操作 的 增强 方法 ,将 每 一 像素 点 的 灰 度 值 按照 一 定 的 数学 变换 转换 
为 一 个 新 的 灰 度 值 。 基 于 灰 度 变换 原理 的 图 像 增强 方法 非常 丰富 ,如 增强 处 理 中 常用 的 直 
接 灰 度 变换 (包括 线性 拉 伸 和 非 线 性 拉 伸 )、 对 比 度 增强 、 直 方 图 均衡 化 、 直 方 图 规定 化 和 图 
像 的 代数 运算 等 方法 都 属于 灰 度 变换 技术 。 

空域 滤波 是 基于 邻 域 处 理 的 增强 方法 , 它 应 用 某 一 模板 对 每 个 像素 点 与 其 周围 邻 域 的 
所 有 像素 点 进行 某 种 确定 数学 运算 得 到 该 像素 点 新 的 灰 度 值 , 输 出 值 的 大 小 不 仅 与 该 像素 
点 的 灰 度 值 有 关 ,而且 还 与 其 邻 域内 的 像素 点 的 灰 度 值 有 关 。 常 用 的 图 像 平 滑 滤 波 与 锐 化 
滤波 技术 就 属于 空域 滤波 的 范畴 。 


5.2.2 频 域 增强 法 


频 域 增强 法 首先 将 图 像 从 空域 按照 某 种 变换 模型 (如 傅 里 叶 变 换 或 其 他 变换 等 ) 变 换 到 
频 域 ,然后 在 频 域 对 图 像 进行 处 理 , 再 将 其 反 变换 到 空域 。 通 常 包括 低 通 、 高 通 、 带 通 和 带 阻 
四 种 典型 的 滤波 器 结构 。 


5.2.3 图像 增 强 效 果 评 价 


目前 对 图 像 增强 效果 的 评价 主要 包括 定性 评价 和 定量 评价 两 个 方面 。 

(1) 定性 评价 主要 根据 人 的 主观 感觉 ,对 图 像 增强 的 视觉 效果 进行 评判 ,一 般 主要 对 图 
像 的 清晰 度 、 色 调 , 纹 理 等 几 方面 进行 主观 评价 。 定 性 分 析 的 不 足 是 与 评价 者 的 主观 性 密切 
相关 , 即 对 同一 幅 被 增强 的 图 像 ,不 同 的 人 可 能 有 不 同 的 评价 。 定 性 分 析 的 主要 优点 是 可 以 
从 一 幅 图 像 中 有 选择 地 对 具体 研究 对 象 进行 重点 比较 和 评价 , 即 定性 分 析 可 以 对 图 像 的 局 
部 或 具体 研究 目标 进行 评价 ,具有 灵活 性 和 广泛 的 适应 性 。 

(2) 定量 评价 图 像 增 强 效果 目前 还 没有 业界 统一 接收 的 标准 与 尺度 ,目前 通常 采用 的 
方法 是 从 图 像 的 信息 量 、 标 准 差 ,均值 .纹理 度量 值 和 具体 研究 对 象 的 光谱 特征 值 等 方面 与 
原始 图 像 进行 比较 评价 。 定 量 分 析 的 最 大 优点 是 客观 公正 ,但 通常 是 对 一 幅 图 像 从 整体 上 
进行 统计 分 析 ,很 难 对 图 像 的 局 部 或 具体 对 象 进行 评价 ,而 图 像 整 体 的 定量 分 析 容 易 受 到 噪 
声 等 因素 的 影响 。 因 此 ,对 图 像 增强 效果 的 评价 一 般 以 定性 分 析 为 主 。 

需要 强调 的 是 ,评价 一 个 图 像 增 强 算法 的 性 能 优越 与 否 是 比较 复杂 的 ,增强 效果 的 好 坏 
不 仅 与 具体 算法 有 一 定 的 关系 ,还 与 原始 图 像 的 数据 特征 直接 相关 。 一 个 对 图 像 A 效果 好 
的 增强 算法 不 一 定 适合 于 图 像 B。 因 此 .为 了 得 到 满意 的 图 像 增强 效果 ,一 般 情况 下 应 同时 
比较 几 种 增强 算法 ,从 中 选 出 既 视觉 效果 好 、 计 算 量 小 ,又 满足 要 求 的 最 优 算法 。 


5.3 直接 灰 度 变换 增强 


顾名思义 ,直接 灰 度 变换 是 直接 对 数字 图 像 的 像素 点 进行 数学 变换 的 一 种 图 像 增强 方 
法 。 它 是 空域 灰 度 变换 (一 般 简 称 为 灰 度 变换 ) 增 强 法 中 一 类 具有 广泛 应 用 的 方法 。 灰 度 变 


到 
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换 增强 法 是 通过 寻求 数学 变换 函数 使 图 像 的 对 比 度 提高 ,在 图 像 空 间 所 进行 的 灰 度 变换 本 
质 上 是 一 种 点 处 理 方法 。 根 据 处 理 的 过 程 ,常用 空域 灰 度 变换 包括 以 下 三 种 : 
(1) 直接 灰 度 变换 ,通过 选择 合适 的 变换 公式 依次 对 每 个 像素 点 进行 处 理 。 
(2) 基于 灰 度 直方 图 的 灰 度 变换 。 
(3) 对 多 个 灰 度 图 像 进行 代数 运算 实现 灰 度 变换 。 
直接 灰 度 变换 增强 法 包括 基于 数学 函数 的 灰 度 变换 方法 和 基于 传统 光学 增强 方法 两 
2 基于 数学 函数 的 灰 度 变换 方法 包括 线性 拉 伸 变换 、 非 线性 拉 伸 变换 方法 。 基 于 传统 光 
学 的 图 像 增强 方法 主要 包括 亮度 调节 、 对 比 度 调节 、 图 像 反 转 等 多 种 方法 。 实 际 上 ,传统 的 
光学 增强 方法 也 可 通过 数学 变换 实现 。 


5.3.1 线性 灰 度 拉 伸 


线性 灰 度 拉 伸 (又 称 为 线性 拉 伸 ) 是 将 输入 图 像 的 灰 度 值 的 
动态 范围 按 线性 关系 拉 伸 扩展 至 指定 范围 或 灰 度 的 整个 动态 范 欠 册 
围 ,图 5-3 所 示 是 一 个 常用 的 灰 度 线性 拉 伸 函 数 关 系 。 对 于 常见 3 
的 8 位 灰 度 图 像 而 言 ,其 最 大 动态 范围 是 [0,255]。 

线性 拉 伸 可 提高 图 像 的 质量 ,如 例 5-1 所 示 。 

例 5-1: 灰 度 图 像 线性 拉 伸 效果 

如 图 5-4 所 示 为 线性 拉 伸 增 强 图 像 视觉 效果 示例 。 图 5-4(a) 
为 128 灰 度 级 图 像 , 图 5-4(b) 为 经 灰 度 线性 拉 伸 为 256 灰 度 级 图 


输入 

像 , 灰 度 拉 伸 以 后 ,图 像 在 亮度 和 对 比 度 等 方面 具有 明显 的 改善 

效果 。 图 5-3 ”线性 变换 对 灰 度 的 

设 /(z,y) 表 示 输 入 图 像 灰 度 值 .g(x,y) 表 示 输出 图 像 灰 
度 值 ,线性 灰 度 拉 伸 采用 的 变换 公式 一 般 为 如 下 线性 方程 : 
(a) 128 灰 度 级 (b) 256 灰 度 级 
图 5-4 线性 灰 度 变换 增强 图 像 的 效果 
g (ry) =axX f(rsy) +b (5-1) 


其 中 ,a,。 的 值 需 根据 具体 应 用 需求 确定 。 线 性 拉 伸 还 可 分 为 按 比 例 线性 拉 伸 和 分 段 
线性 拉 伸 两 种 方法 。 
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1. 按 比例 线性 拉 伸 
如 图 5-5 所 示 , 按 比例 线性 拉 伸 包括 图 5-5(a) 所 示 的 均匀 线性 拉 伸 和 图 5-5(b) 所 示 的 
限 幅 线性 拉 伸 两 种 情况 。 


SC SC 了 ) 


& 
! 
! 
1 
1 
& 
T 
1 
1 
1 
和 本 二 < 全 


Ci bifrx fy) nn a 
a) 外 


图 5-5 按 比例 线性 拉 伸 


nx f(x,y) 


1) 均匀 线性 拉 伸 
均匀 线性 拉 伸 是 线性 拉 伸 中 最 简单 .最 常用 的 一 种 方法 ,根据 图 5-5(a) 可 得 出 其 灰 度 变 
换 关系 为 


(zy) = Sm — Bunnf f(z,y) — fos] gan (5-2) 
sa = fi 
即 
a =EEAfy) altd (5-3) 


2) 限 幅 线 性 拉 伸 

限 幅 线性 拉 伸 是 一 种 在 某 些 特定 应 用 中 具有 重要 意义 的 线性 拉 伸 方法 , 它 将 原始 图 像 
的 低 灰 度 值 和 高 灰 度 值 像素 点 的 灰 度 级 进行 了 适当 的 归并 ,而 对 中 间 部 分 的 灰 度 值 进行 了 
拉 伸 。 实 际 图 像 处 理 中 ,根据 图 像 处 理 的 不 同 应 用 需求 ,原始 图 像 的 归并 部 分 和 拉 伸 部 分 可 
以 灵活 选取 。 根 据 图 5-5(b) ,其 灰 度 变换 公式 为 


2 funf(r ya 
站 六 而 二 全 ce 一 0 二 4 ph A 和 三 - 址 
d b <f(r,y) < frr 


2. 分 段 线 性 拉 伸 
在 图 像 处 理 实践 中 ,为 了 突出 图 像 中 所 关注 的 研究 对 象 ,常常 要 求 分 段 按 不 同比 例 拉 
伸 , 如 图 5-6 所 示 , 即 局 部 拉 伸 某 一 范围 的 灰 度 值 , 或 对 不 同 范围 的 灰 度 值 进行 不 同 的 拉 伸 
处 理 , 即 分 段 线性 拉 伸 。 
实际 上 ,分 段 线性 拉 伸 的 结果 是 仅 将 某 一 局 部 范围 的 灰 度 值 进行 了 拉 伸 ,而 其 余部 分 的 
灰 度 值 是 被 压缩 了 。 对 应 于 图 5-6 所 示 的 两 种 分 段 线性 拉 伸 的 变换 公式 如 下 : 
(1) 对 于 图 5-6(a) ,其 变换 公式 为 
Ef (rsy) 0<fl(r,y) <a 
g(x,y) 一 (5-5) 
A a<f(r,y <M 
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史 
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fe M fe 
(a) (b) 
图 5-6 分 段 ( 局 部 ) 线 性 拉 伸 
(2) 对 于 图 5-6(b) ,其 变换 公式 为 
Ef (zy) 0< f(r,y) <a 
g(xX,y) = EY te & 委 jzry) 一 0 (5-6) 
2 = —0D)+d b<f(z,y) My 
M,—b 


5.3.2 非 线性 拉 伸 


非 线性 拉 伸 是 指 采 用 非 线 性 变换 函数 对 输入 图 像 的 灰 度 进行 拉 伸 变换 。 它 与 分 段 线性 
拉 伸 的 相同 之 处 是 有 选择 地 对 某 一 灰 度 值 范围 进行 了 拉 伸 , 即 不 是 对 图 像 的 整个 灰 度 值 范 
围 进行 拉 伸 ,图 像 灰 度 值 的 某 些 特定 范围 被 拉 伸 了 ,而 其 他 灰 度 值 范围 则 有 可 能 被 压缩 ; 不 
同 点 是 , 非 线性 拉 伸 不 是 通过 在 不 同 灰 度 值 区 间 选 择 不 同 的 线性 函数 来 实现 分 段 拉 伸 或 压 
缩 , 非 线性 拉 伸 在 整个 灰 度 值 范围 内 采用 统一 的 非 线性 变换 函数 ,利用 非 线 性 变换 的 性 质 实 
现 对 不 同 灰 度 值 区 间 的 拉 伸 与 压缩 。 常 用 的 非 线性 拉 伸 函数 包括 对 数 拉 伸 .指数 拉 伸 ,平方 
函数 拉 伸 、 阅 值 函数 拉 伸 和 窗口 函数 拉 伸 等 多 种 处 理 方法 。 
1. 对 数 拉 伸 
对 数 拉 伸 的 形式 为 
gCzyy) = logs[L f(z,y)] {5-79 
式 中 ,a 为 对 数 的 底数 ,可 以 根据 需要 灵活 选择 。 在 实际 应 用 中 ,一 般 取 a 二 e, 即 选择 自然 对 
数 ,具体 形式 为 
g(x,y) = Cln[L f(x,y)+1] (5-8) 
式 中 ,C 为 尺度 比例 系数 ,用 于 调节 动态 范围 ,[f(z,y) 十 1] 是 为 了 避免 对 零 求 对 数 。 如 
图 5-7 所 示 ,对 数 扩展 可 以 将 图 像 的 低 亮度 区 进行 大 幅 拉 伸 , 但 是 高 亮度 区 却 被 压缩 。 
2. 指数 拉 伸 
指数 拉 伸 的 变换 形式 为 
ps = Va (5-9) 
式 中 ,参数 a 可 以 改变 曲线 的 起 始 位 置 ; 参数 C 可 以 改变 曲线 的 变化 速率 ,其 变换 函数 曲线 
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如 图 5-8 所 示 ,指数 扩展 可 以 对 图 像 的 高 亮度 区 进行 大 幅 扩展 。 
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图 5-7 对 数 拉 伸 函数 曲线 图 5-8 指数 拉 伸 函数 曲线 


3. 其 他 拉 伸 函数 
除 以 上 两 种 典型 的 非 线性 拉 伸 函数 之 外 ,其 他 常用 非 线性 拉 伸 还 包括 平方 函数 、 阔 值 函 
数 、 窗 口 函 数 等 多 种 形式 。 


5.3.3， 光学 增强 


图 像 的 光学 增强 法 是 一 种 非常 传统 的 方法 ,许多 光学 增强 方法 曾经 一 度 在 模拟 图 像 处 
理 中 得 到 较 广泛 应 用 。 如 图 像 的 反 转 很 早 就 已 经 在 照相 技术 中 应 用 ,普通 黑白 底片 和 照片 
的 关系 就 是 一 个 相互 反 转 的 关系 ,所 谓 图 像 反 转 就 是 使 图 像 的 灰 度 值 反 转 。 包 括 亮度 调整 、 
对 比 度 调节 等 在 内 的 传统 增强 方法 也 可 以 通过 数学 变换 函数 来 实现 。 


5.4 基于 直方 图 的 图 像 增 强 


基于 灰 度 直方 图 的 图 像 增强 方法 是 三 类 灰 度 变换 方法 中 的 第 二 类 方法 。 直 方 图 是 对 图 
像 每 一 灰 度 值 出 现 的 频率 进行 统计 的 一 种 直观 表示 方法 。 基 于 直方 图 的 图 像 增强 方法 是 以 
概率 统计 学 理论 为 基础 的 ,如 图 像 的 明暗 状况 和 对 比 度 等 特征 信息 都 可 以 通过 直方 图 反映 出 
来 。 如 图 5-9 所 示 , 这 是 同一 幅 图 像 经 过 不 同 处 理 后 的 直方 图 的 四 种 分 布 情况 ,在 图 5-9(a) 
中 ,大 部 分 像素 点 的 灰 度 值 小 于 50, 表 示 该 图 像 亮 度 偏 低 ; 同样 经 过 分 析 可 以 得 出 ,图 5-9(b) 
亮度 偏 高 ,图 5-9(c) 所 示 图 像 灰 度 值 范 围 偏 小 ,而 图 5-9(d) 所 示 图 像 灰 度 值 范围 比较 正常 。 根 
据 该 图 可 以 看 出 ,一 幅 图 像 的 直方 图 从 整体 上 描述 了 一 幅 图 像 的 概貌 特征 ,因此 ,可 以 通过 修 
改 直 方 图 的 方法 来 调整 一 幅 数 字 图 像 的 灰 度 分 布 。 常 用 的 方法 有 直方 图 均衡 化 和 直方 图 规定 
化 等 。 


5.4.1 基本 原理 


一 幅 给 定 的 图 像 ( 原 始 图 像 ) 的 灰 度 级 通过 归 一 化 处 理 可 以 认为 分 布 在 0<r<1 的 范围 
内 ,对 [0,1] 区 间 内 的 任 一 灰 度 级 7 可 以 进行 如 下 形式 变换 : 
s= T(r) 《5=10)》 
根据 式 (5-10) 的 变换 ,原始 图 像 每 一 个 像素 点 的 灰 度 值 都 有 一 个 变换 灰 度 值 对 应 。 
假定 式 (5-10) 表 示 的 变换 函数 满足 以 下 两 个 条 件 : 


让 
a 
贡 
到 
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图 5-9 不 同类 型 的 直方 图 


(1) 在 0<r<1 区 间 内 ,* 王 T(r-) 值 为 单调 增加 。 

(2) 对 于 0<r<1, 有 0<s=T(7)<1。 

上 述 条 件 (1) 用 于 保证 原始 图 像 各 灰 度 级 在 变换 后 仍 保持 从 黑 到 白 ( 或 从 白 到 黑 ) 的 单 
调 排列 顺序 ,条 件 (2) 用 于 在 理论 上 严格 保证 变换 之 后 , 灰 度 值 范围 的 一 致 性 。 根 据 数学 函 
数 关 系 ,从 s 到 + 的 逆 变 换 用 下 式 表 示 : 

Fy 0 5 C5-11) 

由 于 变换 关系 了 满足 上 述 两 个 条 件 ,根据 数学 分 析 ,T :(s) 也 满足 这 两 个 条 件 。 

由 概率 论 知 识 可 知 ,如 果 已 知 随机 变量 7 的 概率 密度 为 P,(7), 而 随机 变量 s 是 x 的 函 
数 , 则 s 的 概率 密度 P,(s) 可 以 由 P,(7) 求 出 ,主要 过 程 如 下 : 

(1) 根据 分 布 函数 的 定义 可 以 求 得 随机 变量 * 的 分 布 函数 下 ,(s) , 即 


F,(s) = | P,(z)dz 


(2) 根据 分 布 函数 与 概率 密度 函数 之 导数 关系 ,可 得 出 P,(s), 即 
中 [从 KK 
ds 


(5-12) 


Le 一 古人 9 
ds 


综 上 所 述 ,直方 图 增强 的 技术 基础 是 通过 * 与 7 之 间 的 变换 函数 (7) 控制 图像 灰 度 级 
的 概率 密度 函数 ,从 而 改善 图 像 的 灰 度 分 布 情 况 。 

通常 情况 下 ,直方 图 均衡 化 对 于 改善 图 像 对 比 度 和 亮度 具有 明显 的 效果 ,如 例 5-2 

例 5-2; 直方 图 均衡 化 对 图 像 效 果 的 改善 

本 示例 给 出 了 一 幅 图 像 直方 图 均衡 化 前 后 的 对 比 效果 。 图 5-10 (a) 是 原始 图 像 、 
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图 5-10(b) 为 原始 图 像 的 直方 图 。 由 于 原始 图 像 的 灰 度 值 分 布 在 中 间 灰 度 值 一 个 较 罕 的 区 
间 ,而 且 亮度 偏 低 , 因 而 图 像 显得 非常 模糊 。 经 过 直方 图 均衡 化 变换 后 ,如 图 5-10(c) 和 
图 5-10(d) 所 示 , 图 像 的 灰 度 值 动态 范围 增加 ,图 像 的 亮度 得 到 了 一 定 程度 的 提升 ,图 像 从 
整体 上 给 人 一 种 明亮 清晰 的 感觉 。 


(a) 原始 图 像 (b) 原始 图 像 灰 度 直方 图 


(©) 结果 图 像 (d) 结果 图 像 灰 度 直方 图 
图 5-10 直方 图 均衡 化 效果 


5.4.2 直方 图 均衡 化 


直方 图 均衡 化 处 理 是 以 累积 分 布 函 数 为 基础 的 直方 图 修改 法 。 直 方 图 均衡 化 的 目的 是 
将 原始 图 像 的 直方 图 变 为 均衡 分 布 的 形式 ,将 一 非 均 匀 灰 度 概率 密度 分 布 图 像 , 通 过 寻求 某 
种 灰 度 变换 , 变 成 一 幅 具 有 均匀 概率 密度 分 布 的 目的 图 像 。 

若 一 幅 图 像 的 直方 图 是 均衡 的 ,其 图 像 灰 度 级 的 取 值 范围 为 L, 则 其 概率 密度 函数 为 


P,(s) = 
由 于 灰 度 级 已 经 过 归 一 化 处 理 ,所 以 有 

L=1 

了 一 这 


故 式 (5-12) 可 改写 为 
ds 一 P,(r)dr 


出 
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对 上 式 进 行 积分 ,可 得 
二 | Popdr 
如 果 取 变换 函数 , 则 有 
[pyar = T(r) (5-13) 


由 此 可 知 , 以 + 的 累积 分 布 函数 作为 变换 函数 ,就 可 以 拓展 原始 图 像 灰 度 值 的 动态 范 
围 ,因而 可 以 将 概率 密度 函数 为 P,(r) 的 图 像 变换 为 具有 均匀 概率 密度 函数 P,(s) 的 图 像 。 
变换 式 (5-13) 是 原始 图 像 的 累积 概率 密度 函数 ,并 且 满 足 直 方 图 变换 函数 的 两 个 条 件 。 

上 述 推导 是 以 连续 变量 为 基础 的 , 若 灰 度 值 是 离散 值 , 则 可 以 采用 灰 度 频数 近似 代替 概 
率 值 。 设 图 像 有 工 个 灰 度 级 ,图 像 像 素 点 总 数 为 n,n 代表 灰 度 级 为 的 像素 点 的 数量 , 则 
第 个 灰 度 级 出 现 的 概率 可 表示 为 

P,(r) 一 此 | 


对 于 离散 情况 , 式 (5-13 ) 为 


k 此 
%= Tt) = PDP) 2) 于 0<n<1,0<kSL-1 (5-14) 
j=0 j=0 
对 应 的 逆 变 换 为 
ri = T's) 


下 面 通 过 一 个 具体 实例 来 说 明 如 何 对 一 幅 图 像 进行 直方 图 均衡 化 处 理 以 及 图 像 经 过 直 
方 图 均衡 化 后 的 增强 效果 。 

例 5-3: 直方 图 均衡 化 计算 原理 与 过 程 

现 有 一 幅 灰 度数 字 图 像 ,像素 数 为 64X64, 共 有 8 个 灰 度 级 ,其 灰 度 级 分 布 如 表 5-1 所 


示 , 现 要 求 对 其 进行 均衡 化 处 理 。 原 始 图 像 的 灰 度 直方 图 如 图 5-11(a) 所 示 , 图 中 横 坐 标 轴 
标记 0、1、…、7 分 别 代表 0、1/7、…、1。 
表 5-1 64X64 大 小 图 像 灰 度 分 布 表 
四 nk Be 
r=0 790 0.19 
n=1/7 1023 0.25 
r:=2/7 850 0.21 
rs=3/7 656 0.16 
n=4/7 329 0.08 
5/ 245 0.06 
re=6/7 122 0.03 
r=1 81 0.02 
直方 图 均衡 化 的 处 理 过 程 如 下 : 


(1) 求 变换 函数 。 
根据 变换 函数 式 (5-14) ,计算 各 灰 度 级 x , 即 


0 
m= TD = HPGy = 019 


j=0 


130 所 数字 图 像 处 理 及 应 用 一 一 使 用 MATLAB 分 析 与 实现 


1 
三 TO) 三 PP) = 0.1940.25=0.44 


j=0 


= Wd = Po) 一 0.19 十 0.25 十 0.21 二 0.65 

依次 计算 可 分 别 得 出 : ss 二 0. 81, ,一 0. 89,ss 二 0.95,s6 二 0. 98,s; 二 1。 

根据 以 上 所 求 出 的 % 和 产 之 间 的 离散 值 关 系 , 可 以 得 出 $ 和 之 间 的 离散 函数 关系 ( 即 
变换 函数 ) 如 图 5-11(b) 所 示 。 

(2) 计算 均衡 化 之 后 的 灰 度 级 。 

由 于 原 图 像 的 灰 度 级 只 有 8 级 ,变换 之 后 的 wx 只 能 选择 最 接近 的 一 个 灰 度 级 ,因此 需 对 
st 进行 舍 入 处 理 ,各 w 将 以 1/7 为 量化 单位 进行 舍 入 运算 ,结果 如 下 : 

so 1/7,s5 A 3/7,s2 ST 5/7,5s A 6/7,54 A 6/7s,ss A 1 ,se 1s A 1。 
根据 对 w 的 会 入 结果 ,均衡 化 后 的 灰 度 级 仅 有 5 个 级 别 , 分 别 是 : 
到 177,si 3/7,s 三 5/7,5 = 6/7,5 = 6/7 

(3) 计算 对 应 每 个 % 的 像素 点 数量 。 

因为 = 二 0, 经 映射 到 so 二 1/7, 所 以 有 790 个 像素 点 取 so 这 个 灰 度 值 ; r= 二 1/7 映射 到 
si 一 3/7, 所 以 有 1023 个 像素 点 取 值 5 二 3/7 这 个 灰 度 值 , 同 理 有 850 个 像素 点 取 值 :一 5/7 
这 个 灰 度 值 ,由 于 rs 和 7 都 映射 到 ss 一 6/7 灰 度 值 , 所 以 有 656 十 329 二 985 个 像素 点 取 此 
灰 度 值 ,同样 有 245 十 122 十 81 二 448 个 像素 点 取 s, 二 1 的 灰 度 值 。 

(4) 绘 出 均衡 化 以 后 的 直方 图 。 

对 于 均衡 以 后 的 每 一 灰 度 级 ,计算 各 n/n 即 可 得 到 均衡 化 后 的 直方 图 ,如 图 5-11(c) 
所 示 。 
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(a) 原始 图 像 直 方 图 


1.00 [i 

0.80 

0.60 

0.40 

0.20 | 

Oh 


5 7 六 


o 
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图 5-11 直方 图 均衡 化 过 程 
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根据 本 例 可 以 看 出 ,对 于 连续 图 像 ,理论 上 可 以 完全 实现 均衡 化 ,但 在 离散 灰 度 级 情况 
下 ,利用 累积 分 布 函 数 作为 灰 度 变换 函数 ,所 得 到 的 直方 图 并 不 能 实现 直方 图 完全 均衡 化 ， 
而 仅 能 在 许可 范围 内 尽 可 能 接近 于 均匀 概率 密度 函数 ,这 是 由 于 灰 度 级 的 不 连续 和 像素 的 
不 连续 所 造成 的 。 

图 5-11(c) 表 明 , 尽 管 没 有 达到 理论 上 的 完全 均衡 化 效果 ,但 目标 图 像 直方 图 比 原 始 图 
像 直 方 图 已 有 很 大 的 改善 。 原 始 图 像 灰 度 值 偏 低 , 图 像 整 体 上 偏 暗 ,直方 图 均衡 化 后 ,其 亮 
度 得 到 了 较 大 的 提升 , 灰 度 值 分 布 比较 均衡 。 

通过 本 例 还 可 以 得 出 , 灰 度 级 由 8 个 缩减 成 为 5 个 ,经 过 直方 图 均衡 化 运算 以 后 ,变换 
后 的 灰 度 级 数量 减少 了 ,这 是 由 于 均衡 化 过 程 中 要 进行 舍 入 运算 造成 的 ,这 种 情况 称 为 “ 简 
并 "现象 。 通 常情 况 下 ,被 简 并 的 是 原始 图 像 中 频数 较 低 (像素 点 较 少 ) 的 一 些 灰 度 级 。 若 这 
些 灰 度 级 构成 的 图 像 细 节 比 较 重 要 , 则 可 以 采用 局 部 自 适 应 直方 图 均衡 化 技术 ,也 可 以 采用 
增加 像素 位 数 (如 以 12 位 灰 度 图 像 代替 8 位 灰 度 图 像 ) 的 方法 来 减少 由 于 灰 度 级 简 并 现象 
所 造成 的 灰 度 级 数量 损失 。 


5.4.3 直方 图 规定 化 


理想 情况 下 ,直方 图 均衡 化 实现 了 图 像 灰 度 的 均衡 分 布 , 对 提高 图 像 对 比 度 、 提 升 图 像 
亮度 具有 明显 的 作用 。 在 实际 应 用 中 ,有 时 并 不 需要 图 像 的 直方 图 具有 整体 的 均匀 分 布 ,而 
希望 直方 图 与 规定 要 求 的 直方 图 一 致 ,这 就 是 直方 图 规定 化 。 它 可 以 人 为 地 改变 原始 图 像 
直方 图 的 形状 ,使 之 成 为 某 个 特定 的 形状 , 即 增强 特定 灰 度 级 分 布 范围 内 的 图 像 。 

1. 基本 原理 

直方 图 规定 化 的 目的 就 是 调整 原始 图 像 的 直方 图 使 之 符合 某 一 规定 直方 图 的 要 求 。 设 
P,(r) 和 P-(z) 分 别 表 示 原 始 灰 度 图 像 和 目标 图 像 的 灰 度 分 布 概率 密度 函数 ,根据 直方 图 规 
定 化 的 特点 与 要 求 ,应 使 原始 图 像 的 直方 图 具有 P:(=) 所 表示 的 形状 。 因 此 ,建立 P,(r) 和 
P.(z) 之 间 的 关系 是 直方 图 规定 化 必须 解决 的 问题 。 

根据 直方 图 均衡 化 理论 ,首先 对 原始 图 像 进 行 直方 图 均衡 化 处 理 , 即 求 变换 函数 : 


j= T0) = | Penodz (5-15) 


现 假定 直方 图 规定 化 的 目标 图 像 已 经 实现 ,因此 ,对 于 目标 图 像 也 采用 同样 的 方法 进行 
均衡 化 处 理 ,因而 有 
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v=G(2) = | Podz (5-16) 
上 式 的 逆 变 换 为 
z= G(v) (5-17) 
上 式 表明 ,可 通过 均衡 化 后 的 灰 度 级 v 求 出 目标 图 像 的 灰 度 级 >。 由 于 对 目标 图 像 和 
原始 图 像 都 进行 了 均衡 化 处 理 ,因此 具有 相同 的 分 布 密度 , 即 
Pi = BC) 
因而 可 以 用 原始 图 像 均 衡 化 以 后 的 灰 度 级 * 代替 wv, 即 
六 二 二 全 (5-18) 
所 以 ,可 以 依据 原始 图 像 均衡 化 后 的 图 像 的 灰 度 值得 到 目标 图 像 的 灰 度 级 >。 
2. 直方 图 规定 化 方法 
根据 上 述 理论 推导 ,可 以 得 出 直方 图 规定 化 处 理 的 一 般 步 又 如 下 : 
(1) 根据 直方 图 均衡 化 原理 ,对 原始 图 像 进行 直方 图 均衡 化 处 理 。 
(2) 按照 目标 图 像 的 概率 密度 函数 P.(z) ,求解 目标 图 像 进行 均衡 化 处 理 的 变换 函数 G(<)。 
(3) 利用 原始 图 像 均 衡 化 中 得 到 的 灰 度 级 ; 代替 ,求解 道 变换 z= 二 G1(s)。 
经 过 上 述 处 理 得 到 的 目标 图 像 的 灰 度 级 将 具有 事先 规定 的 概率 密度 P.(=)。 上 述 变换 
过 程 中 所 包含 的 两 个 变换 函数 T(r) 和 G71(s) 可 形成 复合 函数 , 即 可 表示 为 
z= GT (5-19) 
由 此 可 知 , 无 须 进 行 直方 图 均衡 化 运算 就 可 以 直接 实现 直方 图 规定 化 处 理 , 通 过 复合 函 
数 关 系 有 效 简化 了 直方 图 规定 化 处 理 过 程 , 求 出 T(r) 和 G7™'(s) 之 间 的 复合 函数 关系 就 可 
以 直接 对 原始 图 像 进 行 变换 。 
3. 直方 图 规定 化 的 应 用 
例 5-4: 直方 图 规定 化 计算 原理 与 过 程 
为 便于 与 直方 图 均衡 化 进行 对 比 , 仍 采 用 前 述 直 方 图 均衡 化 相同 大 小 的 64X64 灰 度 图 
像 数 据 ,如 表 5-1 所 示 , 共 有 8 个 灰 度 级 ,根据 直方 图 规定 化 技术 , 按 表 5-2 给 定数 据 对 原始 
图 像 进 行 直 方 图 规定 化 处 理 。 
图 5-12(a) 为 规定 化 直方 图 ,图 中 横 坐 标 轴 标 记 0、1、…、7 分 别 代 表 0、1/7、…、1。 


表 5-2 64X64 大 小 图 像 灰 度 分 布 表 


Zk Palm) 
zo=0 0.00 
z=1/7 0.00 
zz=2/7 0.00 
z=3/7 0.15 
ua/T 0.20 
zs=5/7 0.30 
zs=6/7 0.20 
m=1 0.15 


根据 直方 图 规定 化 的 原理 ,其 处 理 过 程 如 下 : 
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(1) 原始 图 像 直方 图 均衡 化 。 
直方 图 规定 化 处 理 需 首先 对 原始 图 像 进行 直方 图 均衡 化 处 理 , 由 于 与 例 5-3 数据 相同 ， 
因此 可 以 直接 利用 直方 图 均衡 化 的 处 理 结果 。 
(2) 求 变 换 函 数 。 
根据 离散 数字 图 像 概率 密度 变换 函数 的 公式 计算 变换 函数 , 即 
vi = G(z1) = Bp.) 


j=0 


由 此 可 得 


。 
加 一 G(zo) = >)P.(z) 一 P.(zo) = 0.00 
j=0 


1 

w= G(z1) = P.(z;) = P.(z0) + P.(z1) = 0.00 
j=0 
2 

ws = G(z2) = >)P.(z)) = P,(z0) + P(x1) + P.(zs) = 0.00 


j=0 


3 
mw = Ga = >)P.(zi) = P.(zo) 十 P.(zi) 十 P.(z:) 十 P.(z:) = 0.15 


j=0 


以 相同 的 方法 可 分 别 求 出 


w= G2) = DP.(z) = 0.35 


ww = G(s) = 2)P.(z)) = 0.65 


和 


6 
ve = G(z6) = DP.(z,) = 0.85 


j=0 


人 
ww = G(z1) = 2)P.(z) = 1.00 


以 上 数据 表明 了 vw 与 xx 之 间 的 变换 关系 ,根据 这 些 数据 可 得 出 vw 与 > 之 间 的 离散 函数 
关系 ,如 图 5-12(b) 所 示 。 实 际 上 ,这 些 数据 同样 反映 了 vw 与 x, 之 间 的 道 变 换 关 系 ,为 以 5 
代替 w 黄 定 了 基础 。 

(3) 求 z=G-!1(s,)。 

以 5 代替 ,进行 x 二 G (wv) 二 G7 (si) 的 逆 变 换 运 算 , 求 出 最 终 的 灰 度 级 >; 。 在 离散 情 
况 下 , 道 变换 需 进行 近似 处 理 。 例 如 ,最 接近 于 5 二 1/7 二 0.14 的 是 勾 二 0.15, 因 此 可 用 5 代 
蔡 vw ,进行 反 变换 G (5s) 二 z, 即 so 映射 到 灰 度 级 >;: 。 因 此 ,可 得 到 表 5-3 所 示 映 射 关系 。 

表 5-3 si 与 zt 映射 关系 表 


SE RN 
SE z=3/7 
51=3/7 z=4/7 
52=5/7 z=5/7 
=6/7 zs =6/7 
i wl 
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(4) 求 闪 和 xs 的 映射 关系 。 
根据 步骤 (1) 中 得 到 的 六 和 xs: 之 间 的 数值 对 应 关系 可 得 到 :和 xx 之 间 的 映射 关系 ,如 


表 5-4 所 示 。 
表 5-4 ni 与 < 映射 关系 表 

rr zh 
n=0 zs=3/7 
n=1/7 z=4/7 
r=2/7 zs=5/7 
rs=3/7 zs=6/7 
二 zs=6/7 
rs=5/7 27=1 
re=6/7 = 
Ln lad | st | 


(5) 绘 出 规定 化 处 理 直 方 图 。 

根据 表 5-3 和 表 5-4 所 示 的 映射 关系 重新 计算 各 灰 度 级 的 像素 点 的 数量 ,计算 结果 如 
表 5-5 所 示 ,完成 对 原始 图 像 直 方 图 规定 化 运算 的 最 终 处 理 。 图 5-12(c) 为 对 原始 图 像 进 行 
直方 图 规定 化 运算 后 的 结果 直方 图 。 

根据 本 例 的 实际 运算 结果 可 知 ,与 直方 图 均衡 化 的 情况 类 似 ,直方 图 规定 化 的 运算 结果 与 
期 望 直方 图 ( 即 规定 直方 图 ) 之 间 也 存在 一 定 的 差异 ,这 同样 是 由 于 从 连续 到 离散 的 转换 引入 
了 离散 误差 的 原因 ,而 且 这 种 误差 与 原始 图 像 灰 度 级 数量 有 关 , 通 常情 况 下 , 灰 度 级 越 少 ,误差 
越 大 。 但 尽管 存在 误差 ,直方 图 规定 化 对 图 像 亮 度 和 对 比 度 的 提高 依然 具有 很 明显 的 效果 。 


表 5-5 结果 直方 图 统计 数据 


Zh nk P.(z) 
zo=0 0 0.00 
z=1/7 0 0.00 
22 一 2/7 0 0.00 
2 一 3/7 790 0.19 
24 一 4/7 1023 0.25 
zs=5/7 850 0.21 
zs=6/7 985 0.24 
区 一 448 本 ,地 

0.30 
(2 
0.25 
0.20 
0.15 
0.10 
0.05 
0.00 上 1 1 1 1 
四 
(a) 规定 化 直方 图 


图 5-12 直方 图 规定 化 过 程 


| 
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1.00 [ax 


0.80 


0.60 
0.40 


0.20 | 
0.00 1 1 1 | 1 1 1 1 


0 1 2 3 4 5 6 7 2 


(b) 转换 函数 
0.30 
P-(z) 
0.25 
0.20 
0.15 
0.10 
0.05 
000 下 -于 工人 
亲 - 省 -让 可 
(©) 直方 图 规定 化 结果 
图 5-12( 续 ) 


5.5 代数 运算 增强 


第 4 章 已 介绍 了 图 像 的 代数 运算 ,实际 上 ,代数 运算 也 可 以 对 数字 图 像 进行 增强 。 基 于 
代数 运算 的 图 像 增强 方法 是 三 类 灰 度 变换 增强 法 中 的 最 后 一 类 方法 。 

代数 运算 图 像 增强 是 指 通 过 对 多 幅 图 像 进行 某 一 种 或 几 种 代数 运算 增强 图 像 的 某 些 特 
定 信息 ,从 而 达到 改善 图 像 质量 和 效果 的 目的 。 代 数 运算 是 指 对 两 幅 或 两 幅 以 上 图 像 的 相 
应 像素 点 进行 加 、 减 ,乘除 及 其 复合 运算 而 生成 一 幅 新 的 图 像 。 新 图 像 与 原始 图 像 相 比 ,能 
有 效 地 突出 某 些 专题 信息 。 


5.5.1 代数 运算 增强 的 应 用 


具体 而 言 ,代数 运算 用 于 图 像 增 强 包 括 以 下 几 方 面 。 

(1) 通过 对 同一 景物 或 物体 的 多 幅 图 像 进行 求 平均 值 运算 ,理论 上 可 以 起 到 降低 或 消 
除 图 像 加 性 随机 噪声 的 作用 。 

(2) 图 像 间 的 差 值 运算 可 以 获取 图 像 的 时 间 信息 。 两 幅 不 同时 期 的 遥感 图 像 间 的 减法 
运算 可 以 得 到 相应 时 间 段 内 的 动态 信息 , 即 从 前 次 拍摄 到 第 二 次 拍摄 期 间 该 场景 或 其 中 革 
些 物 体 的 变化 情况 。 到 感 图 像 的 相 减 运算 主要 用 于 提取 多 时 相 和 遥感 图 像 中 的 因 时 间 迁 移 所 
发 生 的 变化 信息 ( 即 动态 信息 ) 。 例 如 ,通过 图 像 的 减法 运算 可 以 获得 土壤 荒漠 化 的 动态 变 
化 情况 河流 湖泊 在 汛期 和 干旱 季节 的 水 位 变化 情况 ; 对 同一 地 区 或 场景 冬夏 两 季 的 图 像 
进行 差 值 运 算 可 以 得 到 植被 信息 变化 情况 ,并 可 以 得 到 常 绿 树种 的 覆盖 率 数据 以 及 用 于 对 
某 些 特定 树种 进行 辨识 ; 通过 对 一 个 城市 不 同年 间 的 卫星 遥感 图 像 进 行 差 值 运算 ,可 以 了 
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解 城市 的 发 展 规模 .扩展 速度 及 耕地 占用 情况 等 信息 ,从 而 获得 城市 土地 控制 方面 的 宏观 
信息 。 

此 外 ,在 医学 应 用 等 特殊 领域 ,由 于 医学 检查 的 需要 ,医生 只 关心 指定 的 检查 部 位 、 组 织 
或 器 官 的 病理 信息 ,而 拍摄 过 程 中 却 不 可 能 将 肌肉 脂肪 等 相关 组 织 进行 分 离 , 这 时 这 些 组 织 
就 成 为 了 图 像 的 背景 ,这 些 背 景 信息 与 诊断 目的 是 不 相关 的 ,甚至 对 被 诊断 的 对 象 具 有 不 利 
影响 ,因此 有 必要 消除 或 削弱 这 些 背 景 信息 的 作用 。 如 图 5-13 所 示 , 通 过 消除 检查 部 位 的 
背景 ,可 以 获得 较 理 想 的 诊断 部 位 图 像 信息 。 


二 多 


(a) 含有 背景 的 原始 图 像 ”(b) 消除 背景 的 增强 图 像 
图 5-13 代数 运算 图 像 增强 


需要 注意 的 是 ,尽管 图 像 的 差 值 运算 算法 简单 ,但 有 时 减法 运算 可 能 会 产生 负 像 素 值 ， 
因此 应 特别 注意 并 对 产生 的 负 值 进行 适当 处 理 。 而 差 值 图 像 的 显示 ,一 般 都 要 经 过 适当 的 
灰 度 调整 ,使 差 值 为 0 的 像素 点 的 灰 度 值 映射 到 灰 度 值 范围 的 中 值 ,例如 对 于 8 位 像素 图 
像 , 中 值 为 128, 有 时 也 可 以 将 8 位 像素 图 像 的 差 值 图 像 保存 为 16 位 的 图 像 , 获 得 更 加 细微 
的 动态 变化 信息 。 

(3) 图 像 的 卷 积 运算 (乘法 运算 ) 可 以 对 图 像 的 边缘 轮廓 进行 增强 。 

(4) 图 像 间 的 除法 运算 (通常 为 比值 运算 ) 可 以 消除 地 形 对 遥感 图 像 的 影响 。 


5.5.2 比值 处 理 与 应 用 


图 像 的 比值 处 理 是 指 将 两 个 波段 的 灰 度 图 像 对 应 像素 点 的 灰 度 值 进 行 除法 运算 ,可 推 
广 定 义 为 各 波段 数据 及 其 代数 组 合 后 进行 比值 运算 。 比 值 所 反映 的 不 是 地 物 光 谱 反 射 率 曲 
线 的 特征 ,而 是 波段 间 光 谱 反射 曲线 斜率 变化 的 特征 , 它 可 使 那些 反射 率 相似 而 光谱 反射 曲 
线 斜率 不 同 的 地 物 类 别 得 以 区 分 。 因 为 比值 和 照度 无 关 , 所 以 比值 又 可 以 消除 地 形 及 其 他 
因素 造成 的 光照 条 件 差异 的 影响 。 比 值 运算 属于 图 像 代数 运算 的 一 种 ,常用 于 多 光谱 卫星 
遥感 图 像 处 理 等 方面 。 比 值 处 理 的 图 像 不 是 单个 的 灰 度 图 像 , 而 是 多 波段 的 灰 度 图 像 , 即 必 
须 是 对 多 个 图 像 进行 处 理 。 由 于 通过 卫星 遥感 可 以 获得 同一 区 域 的 多 个 不 同 波段 的 图 像 ， 
采用 比值 处 理 可 以 扩大 不 同 地 物 的 灰 度 值 差异 ,消除 或 减弱 地 形 朝向 和 云层 等 因素 对 图 像 
的 干扰 ,因此 比值 处 理 在 遥感 遥测 中 具有 重要 作用 。 

1. 比值 处 理 原 理 

根据 物理 光学 原理 ,图 像 中 各 像素 点 的 灰 度 值 可 以 理解 为 景物 的 入 射 光 强 (照明 分 量 ) 
和 反射 光 强 (反射 分 量 ) 之 乘积 。 同 一 地 区 的 多 光谱 卫星 图 像 , 由 于 各 个 波段 几乎 是 同时 成 
像 , 所 以 各 个 波段 图 像 的 入 射 光 强 近似 相等 .波段 间 的 比值 可 以 消除 入射 光 强 对 灰 度 值 的 作 
用 。 反 射 光 强 可 以 在 一 定 程度 上 反应 地 物 差异 ,经 比值 处 理 后 ,物体 反射 光 强 的 差异 将 扩 
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大 ,从 而 有 利于 地 物 的 识别 。 有 些 地 物 对 同一 波段 的 光 具 有 相同 或 相似 的 反射 率 ,两 者 间 的 
差异 较 小 ,但 其 对 不 同 波段 光 的 反射 率 差 异 却 很 大 。 如 表 5-6 所 示 ,在 TM4 波段 ,反射 率 分 
别 为 16 和 17; 在 TM7 波段 ,反射 率 分 别 为 1 和 4。 因 此 ,对 于 水 和 沙滩 ,无 论 在 TM4 还 是 
TM7 波段 ,图 像 的 灰 度 值 差异 都 较 小 ,但 两 类 地 物 对 TM4 和 TM7 这 两 个 不 同 波段 光 的 反 
射 率 差别 却 很 大 ,因此 ,经 过 对 水 和 沙滩 的 TM4 与 TM7 不 同 波段 图 像 的 比值 处 理 可 以 充 
分 反映 这 一 差距 。 

表 5-6 波段 反射 率 差异 


波 段 水 体 沙滩 
TM4 16 17 
TM7 1 4 
TM4/TM7 16 4.25 


2. 比值 处 理 在 遥感 图 像 的 应 用 

比值 处 理 在 遥 感 图 像 中 的 应 用 非常 广泛 ,其 中 典型 的 应 用 包括 用 于 解决 “ 同 谱 蜡 物 ” 问 
题 “ 同 物 异 谱 ? 问 题 以 及 用 于 植被 指数 的 测量 等 。 

1)“ 同 谱 异 物 ” 问 题 

所 谓 “ 同 谱 异 物 ” 问 题 ,是 指 尽管 图 像 具 有 相同 的 频谱 特性 ,但 却 是 不 同 的 物体 。 应 用 比 
值 处 理 扩大 不 同 地 物 的 光谱 差异 ,有 些 地 物 在 单 波段 图 像 中 的 差异 较 小 ,通过 选择 适当 的 波 
段 进行 比值 处 理 , 可 以 有 效 扩 大 不 同 地 物 之 间 的 差异 ,解决 图 像 中 存在 的 “ 同 谱 异 物 ” 问 题 。 
比值 波段 的 合理 选择 应 充分 考虑 不 同 波段 特性 和 不 同 的 地 面 物体 群 等 综合 因素 的 影响 ,不 
能 一 概 而 论 ,例如 对 区 分 某 些 地 物 有 效 的 两 个 比值 波段 不 一 定 适合 选择 为 男 一 类 地 物 的 比 

2)“ 同 物 异 谱 ” 问 题 

所 谓 “ 同 物 异 谱 ” 问 题 ,是 指 相同 的 物体 ,但 却 表现 为 不 同 的 频谱 特性 。 光 线 照 射 所 形成 
的 阴影 面 对 卫 星 图 像 的 地 物 识 别 和 信息 提取 具有 和 较 大 影响 ,阴影 的 形成 既 包 括 诸 如 山坡 朝 
向 等 地 形 因素 ,也 包括 浓密 云雾 层 等 因素 的 影响 。 由 于 阴影 的 影响 ,可 能 导致 阴 坡 与 阳 坡 的 
同一 类 地 面 物体 被 误 认 为 是 两 类 物体 , 即 产 生 * 同 物 异 谱 ?现象 。 比 值 处 理 可 以 消除 地 形 的 
影响 ,使 处 在 不 同 坡 向 的 同一 类 地 面 物体 的 灰 度 值 趋向 一 致 。 

3) 植被 指数 测量 

20 世纪 80 年 代 至 90 年 代 , 我 国 曾 应 用 植被 指数 ( vegetation index) 进 行 了 广泛 的 地 表 
覆盖 分 析 研 究 ,植被 指数 测量 是 比值 处 理 在 遥感 图 像 中 最 成 功 的 应 用 之 一 。 植 被 指数 作为 
一 种 简单 而 有 效 的 参考 量 ,在 资源 环境 的 遥感 遥测 中 有 着 广泛 的 应 用 。 由 于 光合 作用 的 影 
响 , 植 被 在 红 光 波段 形成 一 个 吸收 带 ,在 近 红 外 波段 形成 一 个 反射 带 。 因 此 ,理论 上 可 以 通 
过 红外 与 近 红 外 波段 的 比值 信息 反映 植被 信息 , 即 可 以 进行 植被 指数 的 测量 。 由 于 植被 指 
数 与 大 气 效应 .土壤 成 分 .植被 本 身 等 因素 密切 相关 ,所 以 它 具 有 一 定 的 地 域 特征 和 时 效 特 
征 。 最 常用 的 形式 则 是 归 一 化 植被 指数 (NDVDI) , 它 表 示 为 近 红 外 波段 与 红 光 波段 的 差 与 
两 者 的 和 的 比值 。 以 陆地 卫星 TM 为 例 ,可 以 表示 为 


_ TM4— TM3 
NDVI = C TM FIM (5-20) 
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式 中 ,C 是 需要 根据 具体 情况 确定 的 常数 ; TM3 和 TM4 分 别 表 示 红 光波 段 与 近 红 外 波段 。 

此 外 ,植被 指数 还 有 多 种 其 他 形式 ,如 加 权 差 值 植被 指数 、 垂 直 植被 指数 .土壤 修正 植被 
指数 等 。 

尽管 比值 处 理 在 扩大 地 物 间 的 灰 度 差异 .消除 阴影 影响 等 方面 具有 积极 作用 ,但 在 对 还 
感 图 像 进行 比值 处 理 时 应 注意 以 下 问题 : 

(1) 植被 指数 计算 公式 虽然 简单 ,但 其 波段 的 选择 及 相关 参数 的 调整 需要 经 验 并 可 能 
需要 反复 多 次 实验 (如 归 一 化 植被 指数 中 常数 C 的 确定 ) ,以 便 对 地 物 的 光谱 特征 进行 测定 
与 分 析 ,并 根据 分 析 的 结果 调整 相关 的 参数 。 

(2) 与 原始 图 像 相 比 ,比值 处 理 生成 的 图 像 不 具有 独立 的 波谱 意义 ,而 且 还 会 丧失 图 像 
的 一 些 地 形 信息 ,因此 在 对 比值 图 像 进行 彩色 合成 时 ,一 般 要 增加 TM5 波段 ,以 便 能 反映 
地 形 信息 。 

(3) 比值 处 理 在 增强 地 物 间 差异 的 同时 , 某 些 情况 下 ,会 使 图 像 中 的 噪声 信息 放大 , 因 
此 ,必要 时 应 先进 行 低 通 滤波 ,对 图 像 进行 平滑 处 理 后 ,再 进行 比值 处 理 。 


5.6 ”空域 站 波 增强 


一 幅 图 像 通常 记录 了 物体 的 空间 和 光谱 等 多 种 信息 ,对 于 常见 的 灰 度 图 像 , 其 光谱 信息 
是 以 图 像 各 像素 点 的 灰 度 值 来 记录 的 ,各 种 灰 度 变换 方法 都 可 以 达到 增强 光谱 信息 的 目的 。 
图 像 间 的 差 值 运 算 可 以 获取 图 像 的 时 间 信息 , 即 动态 信息 。 图 像 的 空间 纹理 信息 增强 则 可 
以 通过 空域 滤波 和 频 域 滤波 方法 实现 。 

图 像 的 空间 纹理 信息 可 以 反映 图 像 中 物体 的 位 置 .形状 和 大 小 等 特征 。 例 如 ,一 幅 图 像 
内 物体 的 边缘 轮廓 部 分 一 般 灰 度 值 变化 较 大 ,因此 呈现 出 高 频 特征 ,而 一 个 比较 平滑 的 物体 
内 部 ,由 于 灰 度 值 相对 均匀 则 呈现 低频 特征 。 

数字 图 像 处 理 根据 需要 可 以 分 别 采 取 不 同方 法 对 图 像 的 高 频 和 低频 特征 信息 进行 增 
强 。 例 如 ,公安 系统 在 进行 人 像 的 比 对 查询 时 ,就 需要 突出 高 频 信息 增强 五 官 轮廓 特征 信 
息 ,这 样 不 仅 可 以 提高 比 对 速度 ,还 可 以 提升 比 对 的 准确 率 。 增 强 图 像 的 高 频 信息 称 为 高 通 
滤波 , 它 可 以 突出 物体 的 边缘 轮廓 ,从 而 起 到 锐 化 图 像 的 作用 ,因此 又 称 为 锐 化 滤波 器 。 根 
据 频 域 分 析 理 论 ,高 通 滤波 能 起 到 减弱 或 消除 图 像 的 低频 分 量 、 保 留 高 频 分 量 的 作用 。 相 应 
地 , 低 通 滤波 则 是 指 对 图 像 的 低频 信息 进行 增强 ,又 称 为 平滑 滤波 器 。 它 可 以 实现 图 像 的 平 
滑 处 理 , 一 般 用 于 数字 图 像 的 噪声 消除 。 平 滑 滤波 可 以 减弱 甚至 消除 图 像 的 高 频 分 量 、 保 留 
低频 分 量 。 


5.6.1 空域 滤波 模板 


数字 图 像 空域 滤波 的 实现 是 应 用 模板 卷 积 方法 对 每 一 像素 点 的 邻 域 进行 处 理 完成 的 ， 
它 可 分 为 线性 和 非 线 性 两 类 空域 滤波 方法 。 模 板 (template) 运 算 方 法 是 数字 图 像 处 理 中 常 
用 的 一 种 运算 方式 ,图 像 的 平滑 、 锐 化 、 细 化 和 边缘 检测 等 都 运用 到 模板 操作 。 例 如 ,常见 的 
平滑 算法 是 将 原始 图 中 的 一 个 像素 点 的 灰 度 值 和 它 周 围 邻 近 其 他 8 个 像素 的 灰 度 值 相 加 ， 
以 平均 值 作为 目标 图 像 中 该 像素 的 灰 度 值 。 该 运算 可 用 模板 方法 表示 为 
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采用 以 上 形式 模板 就 可 以 实现 上 述 算术 平均 运算 的 功能 。 模 板 操作 实现 了 一 种 邻 域 运 
算 , 即 某 个 像素 点 的 结果 不 仅 和 本 像素 灰 度 值 有 关 ,而 且 和 其 邻 域 点 的 值 有 关 。 模 板 运算 的 
数学 含义 是 卷 积 (或 互相 关 ) 运 算 。 

卷 积 是 一 种 用 途 很 广 的 算法 ,可 用 卷 积 来 完成 各 种 处 理 变 换 , 图 5-14 说 明了 3X3 邻 域 
与 3X3 模板 (又 称 为 卷 积 核 ) 卷 积 运算 的 处 理 过 程 。 邻 域 中 的 每 一 个 像素 点 有 1,f2,…,/fs 分 
别 与 模板 中 的 每 一 个 元 素 hh ,hs,… ,hs 相 乘 , 乘 积 求 和 所 得 的 结果 即 为 中 心 像 素 点 的 灰 度 值 。 


fl f2 他 hl h2 h3 
f (人 16 * h4 hs h6 
全 信介 h7 hg h9 
3X3 邻 域 3X3 模 板 


图 5-14 空域 滤波 模板 卷 积 运算 过 程 


无 论 采 用 什么 样 的 滤波 器 ,也 不 管 是 高 通 或 低 通 滤波 器 ,其 计算 步骤 基本 类 似 。 具 体 过 
程 一 般 如 下 : 

(1) 将 模板 在 图 像 中 依次 移动 ,并 将 模板 中 心 与 每 个 像素 点 依次 重合 (不 包括 边缘 像素 点 )。 

(2) 将 模板 中 的 各 系数 与 其 对 应 的 像素 点 相 乘 ,并 将 所 有 结果 相 加 (或 进行 其 他 运算 ) 。 

(3) 加 权 值 即 为 目标 图 像 中 对 应 模板 中 心 位 置 的 像素 点 灰 度 值 。 

模板 或 卷 积 的 加 权 运 算 中 ,以 下 问题 需要 引起 注意 : 

(1) 图 像 边界 问题 。 当 在 图 像 上 移动 模板 至 图 像 的 边界 时 ,在 原 图 像 中 找 不 到 与 卷 积 
核 中 的 加 权 系数 相对 应 的 9 个 像素 , 即 卷 积 核 悬 挂 在 图 像 缓 冲 区 的 边界 上 ,这 种 现象 在 图 像 
的 上 、 下 、 左 、 右 四 个 边界 上 均 会 出 现 。 一 般 解 决 这 个 问题 有 两 种 简单 方法 : 一 种 方法 是 忽 
略图 像 边界 数据 , 即 不 处 理 图 像 的 边缘 像素 ; 另 一 种 方法 是 在 图 像 四 周 复制 原 图 像 边界 像 
素 的 值 (或 其 他 方法 ), 从 而 达到 平滑 边界 像素 点 的 目的 。 实 际 应 用 中 ,多 采用 第 一 种 方法 。 
开发 软件 时 ,循环 次 数 应 小 于 图 像 的 行列 数 ,对 于 大 小 为 NX N 的 图 像 , 一 般 可 取 N 一 2, 对 
于 图 像 边 界 处 的 像素 点 可 以 通过 边界 拓展 的 方法 进行 处 理 。 
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(2) 卷 积 求 和 计算 出 来 的 像素 值 的 动态 范围 问题 ,对 此 可 简单 地 将 其 值 置 为 0 或 255。 

(3) 模板 的 大 小 与 平滑 效果 直接 相关 ,模板 越 大 ,平滑 的 效果 越 明 显 ,但 模板 太 大 会 造 
成 图 像 的 边缘 信息 的 损失 ,模板 的 大 小 要 在 保证 消除 噪声 的 前 提 下 尽 可 能 保持 图 像 的 边缘 
信息 。 开 发 图 像 应 用 软件 时 ,一 般 通过 设置 对 话 框 的 方式 ,使 用 户 可 以 灵活 选择 甚至 自 定义 
模板 的 大 小 及 模板 系数 。 模 板 大 小 一 般 为 奇数 ,上 且 不 超过 11 X11。 


5.6.2 线性 平滑 滤波 


各 种 线性 平滑 滤波 方法 一 般 都 基于 模板 卷 积 进行 运算 ,平滑 滤波 一 般 用 于 消除 图 像 中 
的 随机 噪声 ,起 到 图 像 平滑 的 作用 。 线 性 平滑 滤波 的 作用 是 对 图 像 的 高 频 分 量 进行 前 弱 或 
消除 ,增强 图 像 的 低频 分 量 。 平 滑 滤波 器 的 设计 比较 简单 , 若 模板 各 系数 取 不 同 的 值 , 就 可 
得 到 不 同 的 平滑 滤波 器 。 

邻 域 均值 滤波 法 和 中 值 滤波 法 是 常用 的 平滑 滤波 方法 ,其 中 , 邻 域 平均 法 是 线性 运算 ， 
而 中 值 滤波 法 是 非 线 性 运算 。 

1， 邻 域 平 均 法 

邻 域 平均 滤波 法 是 将 一 个 像素 点 及 其 邻 域 中 的 所 有 像素 点 的 平均 值 赋 给 输出 图 像 中 相 
应 的 像素 点 ,从 而 达到 平滑 的 目的 ,又 称 均值 滤波 法 。 最 简单 的 邻 域 平均 法 是 所 有 模板 系数 
都 取 相同 的 值 ,例如 , 取 模 板 系数 为 1, 这 种 模板 又 称 为 Box 模板 ,常用 的 模板 为 3X3 和 5X5 


的 两 种 模板 类 型 。 
3X3 模板 : 
i 证 于 
让 1 | 
1 1 1 
5X5 模板 : 
和 ,0 | 
| :i 
上 于 生生 和 
本 宝生 风 王 ， 
本 本 
邻 域 平均 滤波 法 的 运算 公式 为 
re ne zy 一 0,1,2,…,N 一 1 (5-21) 
Nisw 


式 中 ,M 是 以 (z，y) 为 中 心 的 邻 域 像素 点 的 集合 ; N 是 该 邻 域内 像素 点 总 数 。 

对 每 个 像素 点 按 该 公式 进行 计算 即 可 得 到 增强 图 像 中 所 有 像素 点 的 灰 度 值 。Box 模板 
对 当前 像素 及 其 相 邻 的 像素 点 都 一 视 同 仁 , 统 一 进行 平均 处 理 , 可 以 滤 去 图 像 中 的 随机 噪声 
等 。 例 5-5 的 图 像 实验 也 说 明了 这 一 点 。 

例 5-5: 邻 域 平 均 滤波 增强 图 像 示 例 

图 5-15 为 邻 域 平 均 滤 波 增强 图 像 实 验 。 图 5-15 (a) 为 含有 随机 噪声 的 灰 度 图 像 ， 
图 5-15(b) .图 5-15(c) 、 图 5-15(d) 是 分 别 用 3X3、5X5、7X7 模板 进行 平滑 滤波 所 得 到 的 
图 像 。 通 过 该 图 也 可 以 看 出 , 邻 域 平均 法 对 平滑 图 像 具 有 一 定 的 效果 。 
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(b) 3X3 模 板 (9) 5X5 模 板 (d)7X7 模 板 
图 5-15 ” 邻 域 平均 法 的 增强 效果 


例 5-6: 邻 域 平均 滤波 计算 过 程 示例 
如 图 5-16(a) 所 示 为 原始 图 像 数 据 , 对 该 图 像 采 用 3X3 模板 进行 邻 域 平均 滤波 。 


(a) 原始 图 像 (b) 均值 滤波 结果 
图 5-16 3X3 模板 平滑 处 理 过 程 


根据 邻 域 平 均 法 滤波 的 原理 ,采用 3 关 3 模板 对 图 5-16(a) 进 行 滤波 (边缘 像素 点 除外 )， 
以 第 2 行 第 2 列 的 像素 为 例 ,滤波 以 后 该 像素 点 的 灰 度 值 为 
1 XIX1+2X1+1X1+1X1+2X1+2X1+5X1+7X1+6X1)=3 
对 于 第 2 行 第 3 列 的 像素 ,滤波 以 后 该 像素 点 的 灰 度 值 为 


XC2x1 1X1+4X1+2X1+2x 


同样 的 方法 ,可 以 计算 其 他 各 点 的 灰 度 值 。 对 于 各 点 的 灰 度 值 需 进 行 四 舍 五 人 处 理 。 
滤波 结果 如 图 5-16(b) 所 示 。 
2. 加 权 平 均 法 
邻 域 平均 法 认为 被 处 理 像素 与 邻 域 内 其 他 像素 的 作用 相等 ,因此 ,模板 的 系数 完全 相 
等 。 加 权 均 值 滤波 法 认为 ,对 于 被 处 理 的 像素 点 ,其 邻 域内 像素 的 贡献 是 不 一 样 的 , 离 被 处 
理 像素 距离 近 者 ,其 贡献 大 ,因此 ,模板 的 系数 大 小 不 完全 相等 。 以 3X 3 模板 为 例 ,常用 的 
加 权 平 均 模板 矩阵 为 
和 
C3! | (5-22) 
1 


十 3X1 十 7X1 十 6X1 十 8X1)<4 


3. 高 斯 滤波 

高 斯 滤波 (Gauss filter) 实 质 上 是 根据 高 斯 函数 计算 出 来 的 一 种 滤波 模板 ,其 用 途 为 对 图 
像 信号 进行 平滑 消 品 人 处理。 图 像 处 理 的 后 期 应 用 ,其 噪声 是 一 个 很 重要 的 问题 ,因为 误差 会 累 
计 传 递 ,高 斯 平滑 滤波 器 对 于 抑制 服从 正 态 分 布 的 噪声 非常 有 效 , 用 于 得 到 信 噪 比 SNR 较 高 
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的 图 像 (反映 真实 信号 ) 。 高 斯 滤波 对 图 像 邻 域内 像素 进行 平滑 时 , 邻 域内 不 同位 置 的 像素 被 
赋予 不 同 的 权 值 ,对 图 像 进行 平滑 的 同时 ,能 够 更 多 地 保留 图 像 的 总 体 灰 度 分 布 特征 。 

数值 图 像 处 理 中 ,高 斯 滤波 主要 可 以 使 用 两 种 方法 实现 。 一 种 方法 是 离散 化 窗口 滑 
卷 积 , 另 一 种 方法 是 通过 傅 里 叶 变 换 。 一 般 采 用 第 一 种 离散 化 窗口 卷 积 形式 实现 ,5X5 的 
高 斯 模板 为 


(5-23) 


x 
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5.6.3 非 线性 平滑 滤波 


虽然 基于 模板 的 线性 滤波 方法 简便 易 行 ,但 对 于 既 需要 消除 噪声 又 要 保持 好 的 图 像 细 
节 时 ,其 效果 并 理想 ,而 非 线性 滤波 在 这 方面 具有 一 定 的 优势 。 非 线性 滤波 最 经 典 适 用 的 方 
法 是 基于 模板 的 统计 排序 滤波 ,主要 包括 中 值 滤波 .最 大 值 滤波 和 最 小 值 滤波 三 种 方法 ,该 
滤波 方法 基于 滤波 器 所 在 图 像 区 域 中 像素 的 排序 ,由 排序 结果 决定 的 值 代替 中 心 像素 的 值 。 

1. 中 值 滤波 

尽管 邻 域 平均 滤波 法 可 以 起 到 平滑 图 像 的 作用 ,但 在 消除 噪声 的 同时 ,会 使 图 像 中 的 一 
些 细节 变 得 模糊 。 中 值 滤波 法 则 在 消除 噪声 的 同时 还 能 保持 图 像 中 的 细节 部 分 ,防止 图 像 
的 边缘 部 分 模糊 。 中 值 滤波 法 于 1971 年 开始 逐步 由 一 维 时 间 序 列 推广 运用 到 二 维 图 像 信 
号 处 理 , 并 发 挥 了 较 好 的 作用 。 与 邻 域 平均 法 不 同 , 中 值 滤波 是 一 种 非 线性 滤波 , 它 将 邻 域 
内 所 有 像素 点 值 从 小 到 大 排序 , 取 中 间 值 作为 中 心 像 素 点 的 输出 值 。 采 用 中 值 滤波 ,在 一 定 
的 条 件 下 ,可 以 克服 数字 图 像 细 节 模 糊 的 问题 。 

中 值 滤波 的 原理 是 利用 一 个 奇数 点 的 移动 窗口 ,将 窗口 中 心 点 的 值 用 窗口 各 点 的 中 间 
值 代 替 。 

设 (zj (i,j) EF?) 表示 图 像 中 各 像素 的 灰 度 值 .滤波 窗口 为 W 的 二 维 中 值 滤波 可 定 
义 为 

gs = Med{xs} (5-24) 

例如 , 若 窗 口内 有 5 点 ,其 值 分 别 为 118、88、98、128、158, 则 窗口 内 各 点 的 中 值 即 为 
118。 中 值 滤波 与 均值 滤波 不 同 , 它 不 是 通过 对 邻 域内 的 所 有 像素 点 求 平均 值 来 消除 噪声 
的 ,而 是 让 与 周围 像素 点 灰 度 值 的 差 比较 大 的 像素 点 改 取 近似 于 周围 像素 点 灰 度 值 的 值 ,从 
而 达到 消除 噪声 的 目的 。 

例 5-7: 中 值 滤波 增强 图 像 示例 

本 实验 说 明了 不 同 大 小 模板 的 中 值 滤波 的 平滑 效果 ,图 5-17(a) 为 含有 随机 噪声 的 灰 度 
图 像 ,5-17(b) 、5-17(c)、5-17(d) 是 分 别 用 3X3、5X5、7X7 模板 得 到 的 平滑 图 像 。 

从 图 5-17 与 图 5-15 的 比较 可 以 看 出 ,中 值 滤波 一 定 程度 上 保持 了 图 像 的 边缘 轮廓 ,图 
像 比较 清晰 ,其 效果 比 均值 滤波 要 好 ,其 中 以 3X3 模板 效果 最 佳 .7X7 模板 虽然 消除 了 噪 
声 ,但 图 像 内 部 的 边缘 信息 也 变 得 模糊 了 。 


5 草 


2 - 一 ~ 


(a) 噪声 图 像 (b) 3X3 模 板 (c) 5X 5 模板 (d) 7X7 模 板 
图 5-17 中 值 滤波 的 效果 


例 5-8: 中 值 滤波 计算 示例 
如 图 5-18(a) 所 示 为 原始 图 像 数 据 , 采 用 3X3 模板 对 该 图 像 进行 中 值 滤波 。 


3X3 窗 中 值 
滤波 


边界 像素 不 
处 理 


(a) 原始 图 像 (b) 中 值 滤波 结果 
图 5-18 中 值 滤波 处 理 方法 
根据 中 值 滤波 的 原理 ,采用 3X3 模板 对 图 5-18(a) 进 行 滤波 (边缘 像素 点 除外 ) ,可 以 对 
图 像 进行 平滑 处 理 。 以 第 3 行 第 3 列 的 像素 为 例 ,滤波 以 后 该 像素 点 的 灰 度 值 为 


站 流 本 
Med|7 6 8|=6 
7 6 8 
以 同样 的 方法 ,可 以 得 出 除 边缘 点 外 的 其 他 像素 点 的 滤波 值 。 中 值 滤波 结果 如 图 5-18(b) 


所 示 。 
2. 最 大 值 滤波 
最 大 值 滤波 法 的 实现 过 程 与 中 值 滤波 类 似 , 不 同 之 处 是 用 像素 邻 域内 的 最 大 值 代 替 被 


处 理 像 素 的 灰 度 值 实现 滤波 。 其 主要 用 途 是 寻找 最 亮点 。 
计算 公式 为 
gs = Max{ zi} (5-25) 


3. 最 小 值 滤波 

最 小 值 滤波 法 是 用 像素 邻 域内 的 最 小 值 代 蔡 被 处 理 像素 的 灰 度 值 , 从 而 实现 滤波 。 最 
小 值 滤波 器 主要 用 于 寻找 最 暗 点 。 

计算 公式 为 


gs = Minfzy ) (5-26) 


5.6.4 锐 化 滤波 器 


图 像 的 平滑 处 理会 使 图 像 的 边缘 纹理 信息 受到 损失 ,图 像 变 得 比较 模糊 。 如 果 需 要 突 
出 图 像 的 边缘 纹理 信息 , 则 可 以 通过 锐 化 滤波 器 实现 , 它 可 以 消除 或 减弱 图 像 的 低频 分 量 从 
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而 增强 图 像 中 物体 的 边缘 轮廓 信息 ,使 得 除 边 缘 以 外 的 像素 点 的 灰 度 值 趋向 于 零 。 常 用 的 
锐 化 滤波 主要 有 梯度 法 、 拉 普 拉 斯 算 子 法 和 定向 滤波 等 。 

锐 化 滤器 是 以 对 图 像 的 微分 运算 或 差分 运算 为 基础 的 。 微 分 运算 是 求 像素 点 灰 度 值 的 
变化 率 ,而 图 像 内 不 同 物体 边缘 处 的 像素 点 的 灰 度 值 往往 变化 比较 明显 ,因此 微分 运算 或 差 
分 运算 可 以 起 到 增强 边缘 信息 的 作用 。 


1. 梯度 法 
1) 连续 梯度 算 子 
对 于 二 维 连续 系统 ,在 坐标 位 置 (z,y) 处 的 梯度 向 量 为 
GL/Cz.w] = i ti (5-27) 


GL/Cz,3)] 是 一 个 矢量 , 它 指向 /Cz,y) 的 最 大 变化 率 方 向 ,一 阶 偏 导数 拷 和 分别 表 
示 /(z,y) 沿 z 方 向 和 y 方向 的 灰 度 变化 率 。 由 于 梯度 是 向 量 , 因 此 其 幅 值 为 


1G[Lf(z,y)]1= (2) 十 ( 动 (5-28) 


梯度 的 方向 为 
0 一 aretan (3L / HL) (5-29) 
2) 离散 梯度 算 子 
由 于 无 论 z 方 向 还 是 y 方向 ,离散 系统 的 坐标 值 最 小 增 量 为 1, 因 而 以 相 邻 点 之 差 近似 
表示 梯度 分 量 。 
Azf = fmn)— fm—1,n) 
je = f(mn)— fm,n—1) Cy 
梯度 的 幅 值 为 
VF = VA + CA) (5-31) 
在 某 些 情况 下 .为 简单 起 见 ( 避 免 平方 根 运 算 ), 可 以 根据 具体 情况 分 别 采用 如 下 方法 计 
算 梯 度 的 近似 值 : 
ws|Af IH BF| (5-32) 
或 
VF max(| Ar |, | A,f 1) (5-33) 


显然 ,离散 系统 梯度 幅 值 与 上 述 两 种 近似 值 之 间 存在 以 下 关系 : 
maxC| Af |， | Af 1) VAS)Y + AF) SI A I+| AF] (5-34) 
运用 差分 算 子 ,罗伯特 (Robert) 梯 度 算 子 是 常用 的 梯度 差分 法 ,可 以 表示 为 
GLFCzs9] =| F057 —fG+1j+D It| G41 =— G+1)| C5-35) 
罗伯特 梯度 算 子 可 以 用 如 图 5-19 所 示 的 几何 图 形 ffl) ® flitl,)) 
表示 ,该 算 子 实际 上 是 一 种 交叉 差分 运算 法 则 。 显 然 ， 
采用 罗伯特 等 梯度 算 子 时 ,在 图 像 的 最 后 一 行 和 最 后 
一 列 无 法 计算 ,这 时 可 以 采用 前 一 行 或 前 一 列 的 梯度 JrD 。 ® JrHLHD) 
值 近似 代替。 罗伯特 梯度 算 子 、 索 贝尔 算 子 等 在 图 像 


图 5-19 罗伯特 梯度 算 子 运算 图 


加 
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的 边缘 检测 中 具有 广泛 运用 。 
例 5-9: 锐 化 滤波 的 边缘 增强 示例 
本 实验 为 图 像 锐 化 增强 边缘 信息 效果 实验 。 图 5-20(a) 为 米粒 的 原始 图 像 ,图 5-20(b) 
为 采用 罗伯特 梯度 算 子 对 图 像 进行 锐 化 处 理 的 结果 ,图 像 锐 化 后 仅 留 下 灰 度 值 变化 较 大 的 
物体 边缘 点 (不 同 的 梯度 算 子 ,由 于 梯度 取 值 方向 不 同 , 锐 化 图 像 效 果 略 有 差异 ) 。 


(a) 原始 图 像 (b) 锐 化 图 像 
图 5-20 罗伯特 梯度 算 子 图 像 锐 化 结果 


2. 拉 普 拉 斯 算 子 
拉 普 拉 斯 算 子 是 常用 的 边缘 增强 算 子 之 一 , 它 也 是 采用 偏 导 数 运算 ,与 梯度 法 略 有 不 同 
之 处 在 于 拉 普 拉 斯 算 子 采用 的 是 二 阶 偏 导数 ,其 定义 为 


2 92 
vf/=oL+o (5-36) 
az2z ”ay 


对 于 数字 图 像 ,在 某 个 像素 点 (z,y) 处 的 拉 普 拉 斯 算 子 可 采用 如 下 差分 形式 近似 ; 

Vf(z,y) =— fj DD fC— DD f+1)— fi—17))+4f(i7) (5-37) 

通过 罗伯特 梯度 算 子 和 拉 普 拉 斯 算 子 等 典型 锐 化 算法 可 以 看 出 ,平滑 模板 与 锐 化 模板 
的 不 同 之 处 在 于 ,平滑 模板 各 系数 的 符号 均 为 正 , 因 此 平滑 具有 积分 或 求 和 的 性 质 ,而 锐 化 
模板 各 系数 的 符号 则 有 正 有 负 , 而 且 模 板 系 数 的 和 正好 为 0, 即 锐 化 滤波 算法 具有 微分 或 差 
分 的 性 质 。 数 字 图 像 处 理 中 ,可 以 根据 应 用 的 需要 以 及 平滑 模板 与 锐 化 模板 的 性 质 , 自 行 设 
计 出 满足 各 种 应 用 需求 的 模板 算 子 。 

如 图 5-21 所 示 是 图 像 锐 化 效果 的 又 一 示例 。 图 5-21(a) 为 原始 图 像 , 图 5-21(b) 为 采用 
拉 普 拉 斯 算 子 对 图 像 进 行 锐 化 处 理 的 结果 图 像 , 经 锐 化 处 理 后 ,图 像 同样 仅 留 下 灰 度 值 变 化 
较 大 的 物体 边缘 点 。 


(a) 原始 图 像 
图 5-21 拉 普 拉 斯 算 子 图 像 锐 化 结果 
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3. 定向 滤波 

定向 滤波 是 一 种 定向 锐 化 模板 , 它 是 一 种 对 特定 方向 的 物体 形迹 的 增强 手段 ,如 山脉 与 
河流 的 走向 等 。 如 图 5-22 所 示 ,分 别 为 水 平方 向 ,对 角 方 向 和 垂直 方向 的 定向 滤波 模板 算 
子 。 因 此 ,所 谓 方向 模板 是 一 个 各 模板 系数 的 大 小 与 符号 表现 出 一 定 规律 性 和 方向 性 ,并 对 
某 些 方向 的 灰 度 值 变 化 敏感 的 矩阵 ,体现 在 模板 卷 积 的 结果 上 就 是 在 特定 方向 上 取得 较 大 
的 结果 (数值 。 


(a) 水 平方 向 (b) 对 角 方向 (©) 垂直 方向 
5-22 ”常用 定向 滤波 模板 算 子 


5.7 ” 宝 域 平滑 浪 波 处 理 实例 
5.7.1 程序 源 代码 


% 基 于 空域 平滑 滤波 的 消 噪 处 理 程序 MyDenoiseSoft 
function MyDenoiseSoft(action, varargin) 
if nargin<1, 
action = 'InitializeMyDenoiseSoft'; 
end; 
feval(action, varargin{ :}) 
return; 
% 程 序 运行 初始 化 函数 
% 如 果 本 程序 已 经 运行 ,使 之 成 为 当前 运行 程序 
function InitializeMyDenoiseSoft() 
h= findobj(allchild(0)，'tag'，' 基 于 空域 平滑 滤波 的 数字 图 像 消 噪 处 理 程序 ') ; 
if ~isempty(h) 
figure(h(1)) 
return 
end 
ScreenD = get(0, 'ScreenDepth'); 
if screenD>8 
grayres = 256; 
else 
grayres = 128; 
end 
MyDenoiseSoftFig= figure( ... 
'Name', ' 基 于 空域 平滑 滤波 的 数字 图 像 消 品 处 理 程序 '，.. . 
‘NumberTitle', 'off', 'HandleVisibility', ‘on', ... 
'tag'，' 基 于 空域 平滑 滤波 的 数字 图 像 消 噪 处 理 程序 '，... 
‘Visible', 'off', ‘Resize', ‘off',... 
'BusyAction', 'Queue', 'Interruptible', 'off', ... 
'Color', [0.8 0.8 0.8], ... 
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'IntegerHandle', 'off', ... 

‘DoubleBuffer', 'on', ... 

‘Colormap', gray(grayres)); 
figpos = get (MyDenoiseSoftFig, 'position’); 
figpos(3:4) = [560 430]; 
s% 调整 图 像 窗 口 大 小 
horizDecorations = 10; 
vertDecorations = 45; 
ScreenSize = get(0, 'ScreenSize'); 
证 (screenSize(3)<=1) 

% No display connected (apparently) 

screenSize(3:4) = [100000 100000]; 
end 
if (((figpos(3) + horizDecorations)> screenSize(3)) | ... 

((figpos(4) + vertDecorations)> screenSize(4))) 

屏幕 尺寸 太 小 

delete(fig); 

error([ 'Screen resolution is too low ', ... 

'(or text fonts are too big) to run this DenoiseSoft']); 

end 
dx = screenSize(3) - figpos(1) - figpos(3) - horizDecorations; 
dy = screenSize(4) — figpos(2) - figpos(4) ~ vertDecorations; 
if (dx<0) 

figpos(1) = max(5, figpos(1) + dx); 
end 
if (dy<0) 

figpos(2) = max(5, figpos(2) + dy); 
end 
set(MyDenoiseSoftFig, 'position', figpos); 
rows = figpos(4); cols = figpos(3); 


bgcolor = [0.45 0.45 0.45]; % 背景 颜色 
wdcolor= [0.8 0.8 0.8]; 名 窗口 颜色 
gcolor= [111]; 名 文本 颜色 
hs= (cols— (3*128))/4; 多 水 平 距离 
VS = hs/2; 多 垂直 距离 
ifs = hs/3; 多 内 部 框 间距 
多 按钮 及 菜单 参数 


Std. Interruptible = 'off'; 
Std. BusyAction = 'queue'; 
名 图 像 坐标 的 默认 设置 
Ax= Std; 

Ax. Units = 'Pixels'; 

Ax. Parent = MyDenoiseSoftFig; 
Ax. ydir = 'reverse'; 

Ax. XLim= [.5 128.5]; 

Ax. YLim= [.5 128.5]; 
Ax. 
Ax. 
Ax. 


Img.CData= []; 


史 


像 空域 增强 | 147 


148 本 | 数字 图 像 处 理 及 应 用 一 一 使 用 MATLAB 分 析 与 实现 


Img. Xdata= [1 128]; 
Img. Ydata= [1 128]; 
Img. CDataMapping = 'Scaled '; 
Img. Erasemode = 'none'; 
Ctl= Std; 
Ctl. Units = 'Pixels'; 
Ct1. Parent = MyDenoiseSoftFig; 
Btn= Ctl; 
Btn. Style = 'pushbutton'; 
Btn. Enable = 'off'; 
Edit = Ctl; 
Edit. Style= 'edit'; 
Edit. HorizontalAlignment = 'right'; 
Edit. BackgroundColor = 'white'7 
Edit. ForegroundColor = 'black'; 
Menu = Ctl; 
Menu. Style = 'Popupmenu 
Text = Ctl; 
Text. Style = 'text'; 
Text. HorizontalAlignment = 'left'; 
Text. BackgroundColor = bgcolor; 
Text. ForegroundColor = fgcolor; 
btnHt = 26; 
txtHt = 18; 
menuHt = 26; 
editHt = 21; 
% 原始 图 像 
ud. hoOriginalAxes = axes(Ax, ... 
'Position', [hs rows - vs*1.3—-128 128 128]); 
title( ' 原 始 图 像 ); 
ud. hOriginalImage = imagel( Img, ... 
'Parent', ud. hOriginalAxes); 
噪声 图 像 
ud. hCorruptedAxes = axes(Ax, ... 
'Position', [2* hs+ 128 rows— vs*1.3—128 128 128]); 
title( ' 噪 声 图 像 '); 
ud. hCorruptedImage = image(Img, ... 
'Parent', ud. hCorruptedAxes); 
ud. CorruptedImageIsStale = 1; 
ud. hFilteredAxes = axes(Ax, ... 
'Position', [3* hs+256 rows— vs*1.3—128 128 128]); 
title( ' 消 噪 图 像 '); 
ud. hFilteredImage = image( Img, ... 
'Parent', ud. hFilteredAxes); 
sg 图 的 框架 
fleft = ifs; 
fbot = btnHt+ 3.2 x ifs; 
fwid = cols 一 2 * hs/3; 
fht = rows— vs— hs/2—128— btnHt— 3.2*x ifs; 
ud. hControlFrame = uicontrol(Std, ... 
'Parent', MyDenoiseSoftFig, ... 


到 
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'Style', ‘'Frame', ... 
De Pixeld'; s ox 
'Position', [fleft fbot fwid fht], ... 
'BackgroundColor', bgcolor); 
menuWid = (fwid— 4 * ifs)/3; 
menuBot = fbot + fht — vs — menuHt; 
labelBot = fbot + fht — 22; 
labelWid = menuWid/2; 
sg 图 像 选择 的 下 拉 菜 单 
ipleft = fleft + ifs; 
ud. hImgPop = uicontrol(Menu，. . . 
"Position' [ipleft menuBot menuWid menuHt]，. . 
'string', "辣椒 | 钱币 1| 电 路 图 | 米饭 图 | 吸 嘴 | 土星 | 钱币 2| 玻 璃 | 漂浮 物 '， 
'Callback', ‘MyDenoiseSoft( ''LoadNewImage'') '); 
% 图 像 菜单 的 提示 文本 
uicontrol( Text，. . . 
"Position' [ ipleft labelBot menuWid txtHt]，. . 
'String', ' 选 择 原始 图 像 :'); 
% 添加 噪声 菜单 
anleft = fleft + 2 x ifs+ menuWid; 
ud. hAddNoisePop = uicontrol(Menu, .. 
"Position' [anleft menuBot menuWid menuHt], ... 
'String', ' 胡 椒 加 盐 | 高 斯 噪声 | 斑点 噪声 '，... 
'Callback', 'MyDenoiseSoft(''UpdateNoiseType'') '); 
% 添加 噪声 菜单 的 提示 文本 
uicontrol( Text, . 
'Position', [anleft labelBot menuWid txtHt], ... 
'String', ' 噪 声 类 型 选择 :'); 
% 滤波 方法 选择 菜单 
nrleft = fleft + 3* ifs+2*menuNid; 
ud. hNoiseRemovalPop = uicontrol(Menu, ... 
'Position', [nrleft menuBot menuWid menuHt], ... 
'string', ' 中 值 滤波 | 均值 滤波 | 自 适应 滤波 '，... 
'Callback', 'MyDenoiseSoft( ''UpdateFilterType'') '); 
% 滤波 方法 文本 提示 
uicontrol( Text, ... 
'Position', [nrleft labelBot menuWid txtHt], ... 
'String', "噪声 消除 方法 选择 : ') ; 
高 斯 噪声 
ud. hGaussianMean = uicontrol(Edit, ... 
'Position', [anleft + labelWid menuBot — editHt — ifs menuWid — labelWid editHt], ... 
String’, 0.0 
'callback', 'MyDenoiseSoft( '"'EditBoxUpdate'', ''GaussianMean'’) '); 
ud. hTxtGaussianMean = uicontrol( Text, ... 
'Position', [anleft menuBot 一 editHt ~ ifs labelWid txtHt], ... 
'String', ‘Mean: '); 
ud. GaussianMean = 0.0; 
ud. hGaussianVariance = uicontrol (Edit, ... 
'Position', [anleft + labelWid menuBot — 2 * editHt — 2 * ifs menuWid— labelWid editHt], ... 
tring'; V005",... 
'callback', ‘MyDenoiseSoft( ''EditBoxUpdate'', ''GaussianVariance'') '); 
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ud. hTxtGaussianVariance = uicontrol( Text, ... 
'Position', [anleft menuBot — 2 x* editHt — 2 * ifs labelWid txtHt], ... 
'String', 高 斯 噪声 方差 : '); 

ud. GaussianVariance = 0.005; 

名 胡椒 加 盐 噪声 密度 

ud. hSaltNPepperDensity = uicontrol(Edit, ... 


'Position', [anleft + labelWid menuBot — editHt — ifs menuWid — labelWid editHt], ... 


ring'y Wily 
'callback', ‘MyDenoiseSoft( ''EditBoxUpdate'', ''SaltNPepperDensity'') '); 
ud, hTxtSaltNPepperDensity = uicontrol( Text, ... 
"Position' [anleft menuBot — editHt — ifs labelWid txtHt], ... 
'String', "噪声 密 度 : ) 
ud, SaltNPepperDensity= 0.1; 
斑点 噪声 变量 
ud. hSpeckleVariance = uicontrol(Edit, ... 


'Position', [anleft + labelWid menuBot — editHt — ifs menuWid — labelWid editHt], ... 


‘String’, '0.04',... 
'callback', 'MyDenoiseSoft( ''EditBoxUpdate'', ''SpeckleVariance'') '); 
ud. hTxtSpeckleVariance = uicontrol( Text, ... 
"Position' [anleft menuBot — editHt — ifs labelWid txtHt], ... 
'String'，' 斑 点 噪声 方差 : ); 
ud. SpeckleVariance = 0.04; 
名 "添加 噪声 "按钮 
ud. haddNoiseBtn = uicontrol(Btn, ... 
'Position', [anleft fbot + ifs menuWid btnHt], ... 
'String', ' 添 加 噪声 '，... 
'Callback', 'MyDenoiseSoft( ''AddNoise'') '); 
% 中 值 滤波 模板 选择 
ud. hNeighborhoodPop = uicontrol(Menu, ... 
'Position', [nrleft menuBot — menuHt — ifs— txtHt menuWid menuHt], ... 
Ering5 二 区 3 扔 去 汉 | 及 这 二 
'Callback', 'MyDenoiseSoft( ''UpdateNeighborhoodSize"') '); 
% 图 像 菜单 的 文本 标识 
uicontrol( Text, ... 
'Position', [nrleft menuBot ~ ifs— txtHt menuWid txtHt], ... 
'string', ' 模 板 选 择 : '); 
名 "滤波 处 理 " 功 能 按钮 
ud. hApplyFilterBtn = uicontrol(Btn, ... 
'Position', [nrleft fbot + ifs menuWid btnHt], ... 
'String', ' 滤 波 处 理 '，... 
‘Callback', ‘MyDenoiseSoft( "ApplyFilter"') '); 
% "信息 "显示 与 "退出 "功能 
spac = ifsx 2/3; 
ficleft = cols/2; 
ficbot = ifs; 
ficht = btnHt + 2 * spac; 
ficwid= cols/2— ifs; 
ud. hIinfoCloseFrame = uicontrol(Std, ... 
'Parent', MyDenoiseSoftFig, ... 
'Style', 'Frame', ... 
'Units', 'pixels', ... 


出 
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'Position', [ficleft ficbot ficwid ficht], ... 
‘BackgroundColor', bgcolor); 
名 "信息 "显示 与 "退出 "功能 按钮 
ud. hInfo = uicontrol(Btn, ... 
'Position', [ficleft + spac ficbot + spac (ficwid— 3* spac)/2 btnHt], ... 
'string', "信息 '，.…… 
'Callback', ‘helpwin MyDenoiseSoft') ; 
ud. hClose = uicontrol (Btn, ... 
'Position', [ficleft + ficwid/2 + spac/2 ficbot + spac (ficwid— 3* spac)/2 btnHt], ... 
Ed "吉本 ,.， 
'Callback', 'close( gcbf) '); 
6 状态 条 
ud, hStatus = uicontrol(Std, ... 
'Parent', MyDenoiseSoftFig, ... 
'Style', 'text', ... 
'Units', 'pixels', ... 
'Position', [ifs ifs cols/2— 2*x ifs txtHt * 2], ... 
'Foreground', [.800],... 
'Background', wdcolor, ... 
‘Boriz'y /center'; ... 
Mag "Slab was 
'String', 'Initializing MyDenoiseSoft. .. '); 
set(MyDenoiseSoftFig, 'UserData', ud); 
UpdateNoiseType(MyDenoiseSoftFig); 
UpdateFilterType( MyDenoiseSoftFig); 
UpdateNeighborhoodSize(MyDenoiseSoftFig); 
set(MyDenoiseSoftFig, 'visible', 'on', 'HandleVisibility', 'callback'); 


LoadNewImage( MyDenoiseSoftFig) 
set([ud. hAddNoiseBtn ud. hApplyFilterBtn ud. hInfo ud. hClose], ‘Enable', ‘on'); 
return 
名 添加 噪声 到 原始 图 像 
function AddNoise( MyNoiseFig) 
if nargin<1 
MyNoiseFig = gcbf; 
end 
set (MyNoiseFig, 'Pointer', watch'); 
setstatus(MyNoiseFig, 'adding noise to the original image...'); 
ud = get (MyNoiseFig, 'Userdata') ; 
orig = getimage(ud. hOriginalImage); 
Switch ud. NoiseType 


case ' 胡 椒 加 盐 ' 

noisy = imnoise(orig, 'Salt & Pepper', ud.SaltNPepperDensity); 
case ' 高 斯 噪声 ' 

noisy= imnoise(orig，'Gaussian'，ud. GaussianMean, ud.GaussianVariance); 
case ' 斑 点 噪声 ' 


noisy= imnoise(orig, 'Speckle', ud. SpeckleVariance); 
end 
set(ud. hCorruptedImage, 'Cdata', noisy); 
AddNoiseOff ApplyFilterOn(MyNoiseFig); 
set(MyNoiseFig, 'Pointer', 'arrow’'); 


152 去 | 数字 


图 像 处 理 及 应 用 一 一 使 用 MATLAB 分 析 与 实现 


setstatus(MyNoiseFig, ' 按 "滤波 处 理 ” 按钮 消除 噪声 . '); 
ud. CorruptedImageIsStale= 0; 
set(MyNoiseFig, 'UserData’', ud); 
drawnow 
return; 
名 对 噪声 图 像 进 行 滤波 
function ApplyFilter(MyNoiseFig) 
if nargin<1 

MyNoiseFig = gcbf; 
end 
set (MyNoiseFig, 'Pointer', ‘watch'); 


setstatus(MyNoiseFig, 'Applying noise removal filter to the corrupted image... 


ud = get (MyNoiseFig, 'Userdata'); 
noisy = getimage(ud. hCorruptedImage); 
hood = ud. NeighborhoodSize; 

switch ud. FilterType 


case ' 中 值 滤波 ' 
filtered = medfilt2(noisy, [hood hood]); 
case ' 均 值 滤波 ' 
myfilt = ones(hood)/(hood "2); % Boxcar filter 
filtered = filter2(myfilt, noisy, 'same'); 
case ' 自 适应 滤波 
filtered = wiener2(noisy, [hood hood]); 
end 


set(ud. hFilteredImage, 'Cdata', filtered); 
setstatus(MyNoiseFig, ''); 
set(ud. hApplyFilterBtn, ‘enable', 'off'); 
set(MyNoiseFig, 'Pointer', 'arrow'); 
drawnow 
return; 
从 图 像 库 中 读 新 图 像 
function LoadNewImage(MYNoiseFig) 
if nargin<1 
MyNoiseFig = gcbf; 
end 
set(MyNoiseFig, 'Pointer', watch’'); 
ud = get (MyNoiseFig, 'Userdata'); 
v= get(ud. hImgPop, { 'value', 'String'}); 
name = deblank(v{2}(v{1}, :)); 
drawnow 
switch name 
case ' 钱 币 1' 
coins=[]; 
load imdemos coins 名 生成 新 变量 
img = coins; 
case ' 土 星 '， 
saturn=[]; 
load imdemos saturn 
img = saturn; 
case ' 哌 嘴 '， 
pout=[]; 


); 


load imdemos pout 
img = pout; 
case ' 钱 币 2 
quarter = []; 
load imdemos quarter 
img = quarter; 
case ' 电 路 图 '， 
circuit=[]; 
load imdemos circuit 
img = circuit; 
case ' 漂 浮 物 '， 
liftbody128 = []; 
load imdemos liftbody128 
img = liftbody128; 
case ' 辣 椒 '， 
pepper = []; 
load imdemos pepper 
img = pepper; 
case ' 米 饭 图 '， 
rice=[]; 
load imdemos rice 
img = rice; 
case ' 玻 璃 '， 
glass=[]; 
load imdemos glass 
img = glass; 
otherwise 


error( ‘MyDenoiseSoft: Unknown Image Option! '); 


end 
img = double( img) /255; 
set(ud. hOriginalImage, 'Cdata', img); 
set(ud. hAddNoiseBtn, 'Enable', 'on’'); 
AddNoise( MyNoiseFig); 
ApplyFilter(MyNoiseFig); 
return; 
名 更 新 编 框 用 户 变量 值 
function EditBoxUpdate( whichBox) 
MyNoiseFig = gcbf; 
ud = get (MyNoiseFig, "Userdata') ; 
switch whichBox 
case 'SpeckleVariance' 
str = get(ud. hSpeckleVariance, 'String'); 
new = str2doublel( str); 


if isempty(new) | prod(size(new))>1 | new>1 | new<0 


errordlg( ' 斑 点 噪声 方差 值 应 在 [0,1] 之 间 '); 
else 

ud. SpeckleVariance = real(new(1)); 
end 


set(ud. hSpeckleVariance, 'String', num2str(ud. SpeckleVariance)); 


case 'SaltNPepperDensity"' 
str = get(ud. hSaltNPepperDensity, 'String'); 
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new = str2double(str); 
if isempty(new) | prod(size(new))>1 | abs(new)>1 
errordlg( ' 胡 椒 加 盐 品 声 方差 值 应 在 [0,1] 之 间 '); 
else 
ud. SaltNPepperDensity = real (new(1)); 
end 
set(ud. hSaltNPepperDensity, 'String', num2str(ud. SaltNPepperDensity)); 


Case 'GaussianVariance’ 


str = get(ud. hGaussianVariance, 'String'); 
new = str2double( str); 
if isempty(new) | prod(size(new))>1 | new>1 | new<0 
errordlg( 高 斯 噪声 方差 值 应 在 [0,1] 之 间 '); 
else 
ud. GaussianVariance = real (new(1)); 
end 
set(ud. hGaussianVariance, 'String', num2str(ud.GaussianVariance)) 


case 'GaussianMean’ 


str = get(ud. hGaussianMean, 'String'); 
new = str2double( str); 
if isempty(new) | prod(size(new))>1 | abs(new)>1 
errordlg( 'The mean for Gaussian noise should be a scalar in [ -1,1]'); 
else 
ud. GaussianMean = real(new(1)); 
end 
set(ud. hGaussianMean, 'String', num2str(ud.GaussianMean)) 


end 

AddNoiseOn ApplyFilterOff(MyNoiseFig); 

ud. CorruptedImageIsStale= 1; 

setstatus( ' 按 "添加 噪声 " 按钮 给 原始 图 像 添加 噪声 . . ') ; 
set(MyNoiseFig, 'Userdata', ud); 

"滤波 处 理 " 的 允许 与 "添加 噪声 "按钮 的 禁用 功能 的 实现 函数 
function AddNoiseOff_ ApplyFilterOn(MyNoiseFig) 

ud = get(MyNoiseFig, 'UserData'); 

set(ud. hAddNoiseBtn, ‘enable', 'off'); 

set(ud. hApplyFilterBtn, ‘enable', ‘on'); 


名 "滤波 处 理 " 的 禁用 与 "添加 噪声 "按钮 的 允许 功能 的 实现 函数 
function AddNoiseOn_ApplyFilterOff(MyNoiseFig) 

ud = get (MyNoiseFig, 'UserData'); 

set(ud. hAddNoiseBtn, ‘enable', 'on'); 

set(ud. hApplyFilterBtn, ‘enable', 'off'); 

return 

名 噪声 类 型 更 新 

function UpdateNoiseType(MyNoiseFig) 

if nargin<1 


MyNoiseFig = gcbf; 


end 

set(MyNoiseFig, 'Pointer', watch’'); 

ud = get(MyNoiseFig, 'Userdata'); 

v= get(ud. hAddNoisePop, { ‘value', 'String'}); 
noisetype = deblank(v{2} (v{1}, :)); 


ud. NoiseType = noisetype; 

drawnow 

switch noisetype 

case 'Salt & Pepper' 
BringUpSaltNPepperControls(MyNoiseFig); 

Case 'Gaussian’ 
BringUpGaussianControls(MyNoiseFig); 

case 'Speckle'" 
BringUpSpeckleControls(MYNoiseFig) 

end 

AddNoiseOn ApplyFilterOff(MyNoiseFig); 

setstatus( ' 按 "添加 噪声 " 按钮 添加 噪声 . ') ; 

ud, CorruptedImagelsStale= 1; 

set (MyNoiseFig, 'Pointer', 'arrow', 'Userdata’', ud); 

return 

# 实 现 高 斯 噪声 (产生 高 斯 噪声 ) 

function BringUpGaussianControls(MyNoiseFig) 

if nargin<1 
MyNoiseFig = gcbf; 

end 

ud = get (MyNoiseFig, 'Userdata'); 

% 胡椒 加 盐 

set([ud. hSaltNPepperDensity ud. hTxtSaltNPepperDensity], ... 
'Enable', 'off', 'visible', 'off'); 

% 斑 点 

set([ud. hSpeckleVariance ud. hTxtSpeckleVariance], ... 
‘Enable', 'off', 'visible', 'off'); 

高 斯 


set([ud. hGaussianMean ud. hTxtGaussianMean ud. hGaussianVariance ... 


ud. hTxtGaussianVariance], 'Enable', 'on', 'visible', 'on'); 

return 
% 实 现 胡 椒 加 盐 品 声 ( 产 生 胡 椒 加 盐 噪声 ) 
function BringUpSaltNPepperControls(MyNoiseFig) 
if nargin<1 

MyNoiseFig = gcbf; 
end 
ud = get(MyNoiseFig, 'Userdata'); 
名 高 斯 


set([ud. hGaussianMean ud. hTxtGaussianMean ud. hGaussianVariance ... 


ud. hTxtGaussianVariance], 'Enable', 'off', ‘visible', 'off'); 
名 斑点 
set([ud. hSpeckleVariance ud. hTxtSpeckleVariance], ... 
'Enable', 'off', 'visible', 'off'); 
名 胡椒 加 盐 
set([ud. hSaltNPepperDensity ud. hTxtSaltNPepperDensity], ... 
'Enable', 'on', 'visible', 'on'); 
名 实现 斑点 噪声 
function BringUpSpeckleControls(MyNoiseFig) 
if nargin<1 
MyNoiseFig = gcbf; 
end 
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ud = get (MyNoiseFig, 'Userdata'); 
高 斯 
set([ud. hGaussianMean ud. hTxtGaussianMean ud. hGaussianVariance ... 
ud. hTxtGaussianVariance], 'Enable', 'off', 'visible', 'off'); 
名 胡椒 加 盐 
set([ud. hSaltNPepperDensity ud. hTxtSaltNPepperDensity], ... 
'Enable', 'off', 'visible', 'off'); 
名 斑点 
set([ud. hSpeckleVariance ud. hTxtSpeckleVariance], ... 
'Enable', 'on', 'visible', 'on'); 
更 新 滤波 方法 
function UpdateFilterType( MyNoiseFig) 
if nargin<1 
MyNoiseFig = gcbf; 
end 
ud = get (MyNoiseFig, 'Userdata'); 
v= get(ud. hNoiseRemovalPop, { 'value', 'String'}); 
ud. FilterType = deblank(v{2}(v{1}, :)); 
证 ~ud.CorruptedImagelsStale 
set(ud. hApplyFilterBtn, ‘Enable', ‘on'); 
setstatus( ' 按 "滤波 处 理 " 按钮 消除 噪声 . ') ; 
end 
set(MyNoiseFig, 'UserData', ud); 


% 更 新 邻 域 模板 
function UpdateNeighborhoodSize(MyNoiseFig) 
if nargin<1 
MyNoiseFig = gcbf; 
end 
set(MyNoiseFig, 'Pointer', ‘watch'); 
ud = get (MyNoiseFig, 'Userdata'); 
v= get(ud. hNeighborhoodPop, { 'value', 'String'}); 
neighborhood = deblank(v{2} (v{1}, :)); 
ud. NeighborhoodSize = str2double(neighborhood(1)); 
if 一 ud, CorruptedImageIsStale 
set(ud. hApplyFilterBtn, ‘Enable', ‘on'); 
setstatus( ' 按 "滤波 处 理 " 按钮 消除 噪声 . ') ; 
end 
set(MyNoiseFig, ‘UserData', ud, 'Pointer', ‘arrow’); 


5.7.2 应 用 举例 


程序 MyDenoiseSoft 建立 在 MATLAB 2008 软件 包 的 基础 上 ,在 MATLAB 环境 下 运 
行 该 程序 ,可 进行 基于 空域 平滑 滤波 的 数字 图 像 消 噪 处 理 运 算 方面 的 应 用 ,该 程序 可 进行 不 
同 噪声 条 件 下 的 中 值 滤波 ,均值 滤波 、 自 适应 滤波 等 方面 的 消除 噪声 应 用 。 程 序 运行 界面 如 
图 5-23 所 示 。 
如 图 5-24 所 示 , 单 击 “选择 原始 图 像 * 下 方 的 三 角形 按钮 ,可 选择 已 经 给 定 的 各 种 原始 
图 像 , 单 击 “ 噪 声 类 型 选择 ?可 对 原始 图 像 添加 胡椒 加 盐 等 三 种 具有 典型 意义 的 噪声 类 型 。 
本 程序 还 包括 * 抑 制品 声 方法 选择 等 对 话 框 , 从 中 可 选择 中 值 滤波 .均值 滤波 和 自 适 应 滤波 
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等 消 噪 方法 。 
上》 基于 空城 平 澡 渡 波 的 数字 图 像 消 吧 处 理 程序 
File Edit View Insert Tools Window Help 
斑点 吻 声 方 基 0002 攻 2 
高 其 吹 声 方 基 
(a) 选择 原始 图 像 (b) 噪声 类 型 选择 
图 5-24 程序 MyDenoiseSoft 部 分 对 话 框 
习题 
多 


像 噪声 按 其 产生 的 原因 可 以 分 为 几 种 类 型 ? 

像 噪声 具有 哪些 特点 ? 

像 增强 技术 能 增加 原始 图 像 的 信息 吗 ? 为 什么 ? 

简 述 图 像 增强 方法 的 主要 类 别 。 

图 像 增强 效果 的 评价 方法 主要 包括 哪些 ? 

. 在 图 像 增 强 技 术 中 ,常用 的 空域 灰 度 变换 包括 哪 几 种 ? 

. 什么 是 线性 灰 度 拉 伸 ? 线性 灰 度 拉 伸 可 以 分 为 几 种 情况 ? 

. 非 线性 拉 伸 主要 包括 哪些 类 型 ? 试 比 较 非 线性 拉 伸 与 分 段 线性 拉 伸 各 有 哪些 特点 。 
. 试 简 述 直方 图 均衡 化 实现 图 像 增强 的 主要 步 又 。 
10. 通常 情况 下 ,对 数字 图 像 的 直方 图 均衡 化 可 以 产生 完全 均匀 分 布 的 直方 图 吗 ? 为 


图 
图 
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做 砍 

11. 什么 是 直方 图 均衡 化 的 “ 简 并 "现象 ? 通常 情况 下 ,被 简 并 的 是 原始 图 像 中 的 哪些 
信息 成 分 ? 

12. 选 定 一 幅 图 像 ,编写 MATLAB 程序 对 其 实现 直方 图 均衡 化 处 理 , 根 据 处 理 结果 分 
析 均 衡 化 对 图 像 有 哪些 作用 。 

13. 什么 是 直方 图 规定 化 技术 ? 简 述 直方 图 规定 化 图 像 增 强 的 主要 步 又。 

14. 试 总 结 和 比较 直方 图 规定 化 与 直方 图 均衡 化 的 实现 原理 。 

15. 车 一 幅 图 像 共有 8 个 灰 度 级 ,每 一 灰 度 级 的 概率 分 布 如 表 5-7 所 示 , 现 要 求 根据 如 
表 5-8 所 示 的 规定 化 直方 图 数据 ,对 原始 图 像 进 行 直方 图 规定 化 处 理 。 


表 5-7 原始 图 像 灰 度 分 布 表 表 5-8 ”规定 化 直方 图 灰 度 分 布 表 
rs Pi = zk P:(z1) 
ro=0 0.174 zo=0 0.00 
n=1/7 0.088 z=1/7 0.40 
r=2/7 0.086 zz=2/7 0.00 
r=3/7 0. 080 zs=3/7 0.00 
ni=4/7 0.068 z=4/7 0.20 
rs=5/7 0.058 zs=5/7 0.00 
rs=6/7 0.062 zs=6/7 0.00 
r=1 0. 384 z1=1 0.4 


16. 数字 图 像 的 空域 滤波 主要 包括 哪 几 种 情况 ? 

17. 什么 是 邻 域 平均 滤波 法 ? 它 具 有 哪些 主要 特点 ? 

18. 选择 一 幅 图 像 ,编写 MATLAB 程序 对 其 进行 邻 域 平均 滤波 ,观察 滤波 效果 ,总 结 
邻 域 平均 滤波 的 适应 性 和 相关 特点 。 

19. 非 线性 滤波 中 常用 的 方法 有 哪 几 种 ? 各 有 何 特点 ? 

20. 选择 一 幅 图 像 并 添加 椒盐 噪声 ,编写 MATLAB 程序 对 图 像 进行 中 值 滤波 ,观察 滤 
波 效 果 。 

21. 什么 是 锐 化 滤波 ? 常用 的 锐 化 滤波 方法 主要 有 哪 几 种 ? 
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图 像 增强 是 数字 图 像 处 理 常用 的 技术 之 一 ,其 目的 是 改善 图 像 的 质量 以 达到 突出 图 像 
特征 或 达到 赏心悦目 的 效果 。 数 字 图 像 处 理 方法 主要 分 为 两 大 类 : 一 类 是 在 空间 域 直接 对 
图 像 进行 处 理 , 称 为 空域 法 ; 另 一 类 是 变换 到 某 种 变换 域 对 图 像 进 行 分 析 和 处 理 , 称 为 变换 
域 处 理 法 。 基 于 传 里 叶 变 换 的 频 域 分 析 方 法 物理 意义 明晰 ,是 一 种 非常 重要 的 变换 域 处 理 
法 ,在 图 像 处 理 中 具有 广泛 的 应 用 。 本 章 主 要 介绍 图 像 的 频 域 增强 方法 ,这 些 方法 包括 频 域 
低 通 滤波 、 高 通 滤波 、 带 通 滤 波 、 带 阻 瀑 波 和 同 态 滤 波 等 。 


6.1 低 通 琅 波 


图 像 从 空间 域 变换 到 频率 域 后 ,其 低频 分 量 对 应 图 像 中 灰 度 值 变化 比较 缓慢 的 区 域 , 而 
高 频 分 量 则 表示 了 图 像 中 物体 的 边缘 和 随机 噪声 等 信息 。 低 通 滤 波 器 的 功能 是 通过 低 通 滤 
波 器 函数 互 减弱 或 抑制 高 频 分 量 , 保 留 低频 分 量 。 因 此 , 低 通 滤 波 与 空域 中 的 平滑 滤波 器 
在 功能 上 一 样 ,可 以 消除 图 像 中 的 随机 噪声 .削弱 边缘 效应 ,起 到 平滑 图 像 的 作用 。 

傅 里 叶 变 换 和 卷 积 理论 是 频 域 滤波 技术 的 基础 ,因此 ,在 频率 域 空间 的 滤波 与 空域 滤波 
一 样 可 以 通过 卷 积 运算 实现 。 常 用 的 低 通 滤波 器 包括 理想 低 通 滤波 器 、 巴 特 沃 斯 低 通 滤波 
器 、 指 数 低 通 滤波 器 和 梯形 低 通 滤 波 器 等 多 种 类 型 。 

设 g(x,y) 表 示 函 数 /(z,y) 与 线性 移 不 变 算 子 AKCz,y) 进 行 卷 积 运算 的 结果 , 即 

g(Czsy) = f(xy) * hl(r,y) 三 <] 


因此 可 得 
Gl(usv) = Fl(u,v)H(u,v) (6=27 

式 中 ,G、F\H 分 别 是 函数 g(xz,y)、f(z,y)、h(z,y) 的 傅 里 叶 变 换 ; 及 (u,v) 称 为 滤波 
器 函数 ,也 可 以 称 为 传递 函数 。 在 图 像 增 强 中 ,由 于 待 增强 的 图 像 函 数 /(z,y) 是 已 知 的 , 因 
此 Fux,u) 可 由 图 像 的 传 里 叶 变换 得 到 。 

实际 应 用 中 ,首先 需要 确定 及 (w,v) ,然后 就 可 以 求 得 Glu,v) ,再 对 Glu,v) 进 行 傅 里 叶 
逆 变 换 , 即 可 得 到 增强 的 图 像 g(z,y)。g(z,y) 可 以 突出 /(z,y) 的 某 一 方面 的 特征 信息 。 
车 通过 瓦 (xz) 增 强 F(u,v) 的 高 频 信 息 , 如 增强 图 像 的 边缘 信息 等 , 则 为 高 通 滤波 ; 如 果 增 
强 下 (u,v) 的 低频 信息 ,如 对 图 像 进 行 平滑 操作 等 , 则 为 低 通 滤波 。 频 域 滤 波 方法 的 系统 框 
图 如 图 6-1 所 示 。 其 滤波 处 理 过 程 可 以 分 为 以 下 三 个 步骤 : 
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(1) 对 原始 图 像 fCz,y) 进 行 傅 里 叶 变换 得 到 F(u,v)。 
(2) 将 (u,v) 与 滤波 器 函数 及 (u,v) 进 行 卷 积 运算 得 到 G(u,v)。 
(3) 对 G(u,v) 进 行 传 里 叶 道 变 换 , 即 可 求 出 增强 图 像 gCz,y) 。 


7 | FFT 变 换 [FD jw) | G&D | IFFT 变 换 | 8G 
( 传 里 叶 变 换 ) (传递 函数 ) ( 傅 里 叶 逆 变 换 ) 


图 6-1 频 域 滤波 系统 框图 


6.1.1 理想 低 通 滤波 器 


本 章 只 讨论 径 向 对 称 的 零 相 移 滤波 器 函数 , 几 种 常用 的 低 通 滤 波 器 形式 如 下 。 二 维 的 
1 D(u,v) < D, 
H(u,v) = (6-3) 
a Dlu,v) > Du 
式 中 ,Du 是 一 个 非 负 整数 , 即 理 想 低 通 滤波 器 的 截止 频率 ; D(u,v) 是 从 点 (u,v) 到 频 
域 原点 的 距离 , 即 
Dl(usv) = Vt (6-4) 
因此 ,H(u,v) .uww 组 成 了 理想 低 通 滤波 器 的 三 维 图 形 。 如 图 6-2 所 示 , (a) 和 (b) 分 别 
为 理想 低 通 滤波 器 的 三 维 透视 图 和 二 维 齐 面 图 。 理 想 低 通 滤波 器 的 作用 是 将 小 于 D。 的 频 
率 , 即 以 Du 为 半径 的 圆 内 的 所 有 频率 成 分 可 以 无 衰减 通过 ,而 大 于 Du 的 频率 则 被 完全 截 
止 不 能 通过 。 


H(u, vu) h Hlu, v) 


(a) 三 维 透视 图 (b) 二 维 剖面 图 
图 6-2 理想 低 通 滤波 器 的 三 维 透 视图 和 二 维 剖 面 图 


理论 上 给 出 的 滤波 器 函数 (包括 高 通 滤 波 ) 形 式 都 是 以 坐标 原点 径 向 对 称 的 ,而 对 于 一 
个 数字 图 像 所 对 应 的 NX N 频 域 矩 阵 , 坐 标 原 点 是 该 矩形 的 中 心 , 因 而 滤波 器 理想 特性 一 
般 如 图 6-2 所 示 。 理 想 低 通 滤波 器 的 数学 定义 形式 非常 简洁 ,其 平滑 作用 的 物理 意义 非常 
明显 ,但 在 图 像 处 理 过 程 中 会 产生 比较 严重 的 模糊 与 振 铃 现象 。 因 为 ,根据 传 里 叶 变 换 的 性 
质 , 若 电 (u,v) 为 理想 的 矩形 特性 ,那么 其 逆 变 换 h(xz,y) 的 特性 会 产生 无 限 的 振 铃 特性 ， 
h(xz,y) 与 /(z,y) 卷 积 运算 后 将 给 目标 图 像 gCz,y) 造 成 模糊 与 振 铃 现象 。 而 且 Du 越 小 ， 
这 种 现象 越 明显 。 

此 外 ,在 截止 频率 D。 处 垂直 截止 的 理想 低 通 滤波 器 只 能 通过 计算 机 模拟 实现 ,无 法 采 
用 电子 器 件 实现 。 
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6.1.2 巴特 沃 斯 低 通 滤波 器 
巴特 沃 斯 (Butterworth) 低 通 滤波 器 的 传递 函数 为 


式 中 ,D, 为 截止 频率 ; n 为 滤波 器 的 阶 次 。 
和 理想 低 通 滤波 器 一 样 ,巴特 沃 斯 低 通 滤波 器 的 mx 
特性 曲线 同样 为 三 维 图 形 ,其 谢 面 示意 图 如 图 6-3 所 1 
示 。 一 般 情 况 下 , 当 五 (x,u) 下 降 至 最 大 值 的 1/2 时 的 
D(u,v) 为 截止 频率 D, 。 实 际 应 用 中 ,有 时 也 取 H(u,v) 
下 降 至 最 大 值 的 0.707 时 的 D(u,v) 作 为 截止 频率 Du ， ， 
这 时 传递 函数 为 FT 
1 Do 


H(u,v) mw (6-6) 
1+ (ED [0] 图 6-3 巴特 沃 斯 低 通 滤波 器 剖面 示意 图 
0 


巴特 沃 斯 低 通 滤波 器 又 称 为 最 大 平坦 滤波 器 ,其 通 带 与 阻 带 之 间 的 过 渡 比 较 平坦 。 因 
此 ,巴特 沃 斯 低 通 滤 波 器 的 特点 是 在 通过 频率 与 截止 频率 之 间 没 有 明显 的 不 连续 性 ,不 会 出 
现 “ 振 铃 " 现 象 , 其 效果 好 于 理想 低 通 滤波 器 。 

例 6-1: 数字 图 像 巴 特 沃 斯 低 通 滤波 实验 

如 图 6-4 所 示 是 图 像 的 巴特 沃 斯 低 通 铝 稍 实例 。 图 6-4(a) 为 带 高 频 噪声 的 原始 图 像 ， 
图 6-4(b) 为 对 原始 图 像 进行 巴特 沃 斯 低 通 滤波 的 结果 。 观 察 原 始 图 像 , 显 然 噪 声 信号 比 图 
像 中 的 电路 变化 快 很 多 ,属于 高 频 信号 ,经 过 低 通 滤波 以 后 , 较 好 地 消除 了 噪声 ,但 图 像 也 一 
定 程 度 上 变 模糊 了 。 


(a) 原始 图 像 (b) 滤波 以 后 图 像 
图 6-4 巴特 沃 斯 低 通 滤 波 消除 噪声 


巴特 沃 斯 低 通 滤波 MATLAB 代码 如 下 : 
*# 巴 特 沃 斯 低 通 滤波 


clc; 

close all; 

image_ circuit = imread( 'circuit. tif'); 

image circuit = imnoise( image circuit, 'gaussian', 0.05); 


I= im2double( image circuit); 
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M=2#*size(I,1); 
N=2x#*size(I,2); 

u= —M/2:(M/2— 1); 

v= —N/2:(N/2— 1); 

[U,V] = meshgrid(u, v); 

D= sqrt(U.^2+V.^2); 

DO= 50; 

n=6; 

H=1./(1+ (D./D0).^(2*n)); 
F=fftshift(fft2(1, size(H,1), size(H,2))); 
G=F. *H; 

L= ifft2(fftshift(G)); 
L=L(1l:size(I,1),1:size(I,2))7 
Subplot(121) 

imshow( image_circuit); 

subplot (122); 

imshow(L); 


6.1.3 指数 低 通 滤波 器 


指数 低 通 滤波 器 的 传递 函数 为 
Hlu,y) = et (6-7) 
一 般 情况 下 , 取 瓦 (x,u) 下 降 至 最 大 值 的 1/2 时 的 D(u,v) 为 截止 频率 Du ,其 剖面 图 如 
图 6-5 所 示 。 与 巴特 沃 斯 低 通 滤波 器 一 样 ,指数 低 通 滤波 器 从 通过 频率 到 截止 频率 之 间 具 
有 一 段 平 滑 的 过 渡 带 ,也 没有 明显 的 不 连续 性 。 


6.1.4 梯形 低 通 滤波 器 


梯形 低 通 滤波 器 的 传递 函数 为 
I D(u,v) = Do 
(us0) — 
H(u,v) = 2 D, < Du,v) <D, (6-8) 
0 D(u,v) > Di 


梯形 低 通 滤波 器 的 剂 面 图 如 图 6-6 所 示 。 从 中 可 以 看 出 ,在 Du 的 尾部 包含 有 一 部 分 
高 频 分 量 (D, 之 Du) ,因而 ,结果 图 像 的 清晰 度 较 理想 低 通 滤波 器 有 所 改善 , 振 铃 效应 也 有 所 
减弱 ,应 用 时 通过 调整 D, 值 , 既 能 达到 平滑 图 像 的 目的 ,又 能 使 图 像 保持 足够 的 清晰 度 。 
H(u, vu) 
1 Hu, v) 


= 
Do 0 Do Di De v) 


图 6-5 指数 低 通 滤波 器 剖面 图 图 6-6 梯形 低 通 滤波 器 剖面 图 
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根据 DFT 变换 的 性 质 和 频谱 分 布 特点 ,二 维 DFT 的 频谱 主要 集中 在 低频 处 。 因 此 ,在 
设计 和 应 用 低 通 滤波 器 时 ,一 定 要 注意 二 维 DFT 的 频谱 特点 ,如 例 6-2 所 示 。 

例 6-2: 数字 图 像 低 通 滤波 实验 

如 图 6-7 所 示 是 图 像 低 通 滤波 及 其 截止 频率 对 滤波 效果 的 影响 实验 。 图 6-7(a) 为 一 幅 
256X256 的 数字 图 像 ,图 6-7(b) 为 原始 图 像 的 傅 里 叶 频谱 。 当 选取 截止 频率 到 原点 的 距离 
DD, 二 5 时 ,理想 低 通 滤波 器 可 以 保存 能 量 的 90%; 当 D,=11 时 ,通过 的 能 量 迅速 增加 , 低 通 
滤波 器 能 保存 能 量 的 95%; 当 D, 二 22 时 , 则 可 以 保存 总 能 量 的 98%; 当 Do 二 45 时 , 则 可 
以 保存 总 能 量 的 99%。 图 6-7(c) 图 6-7(d)、 图 6-7(e)、 图 6-7(f) 分 别 为 D, 取 上 述 数值 时 
的 滤波 效果 。 因 此 ,合理 地 选取 D。 是 应 用 低 通 滤波 器 平滑 图 像 的 关键 。 


图 6-7 截止 频率 D, 对 低 通 滤波 的 影响 


6.2 高 通 璃 波 


图 像 中 物体 的 边缘 及 其 他 灰 度 变化 较 快 的 区 域 与 图 像 的 高 频 信 息 有 关 , 因 此 利用 高 通 
滤波 器 可 以 对 图 像 的 边缘 信息 进行 增强 ,起 到 锐 化 图 像 的 作用 。 高 通 滤 波 器 包括 理想 高 通 
滤波 器 ` 巴 特 沃 斯 高 通 滤波 器 、 指 数 高 通 滤波 器 和 梯形 高 通 滤波 器 等 多 种 类 型 。 与 低 通 滤波 
器 相同 ,本章 只 讨论 径 向 对 称 的 零 相 移 滤波 器 函数 。 

6.2.1 理想 高 通 滤波 器 

二 维 理想 高 通 滤 波 器 的 传递 函数 为 


0 Dl(u,w)<D, 
H(u,v) = 046-9) 
1 Dl(u,v) 二 Du 


式 中 ,Du 是 一 个 非 负 整数 , 即 理想 高 通 滤波 器 的 截止 频率 ; D(u,v) 是 从 点 (u,v) 到 频 
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Dlusv) = V+ 
图 6-8 给 出 了 理想 高 通 滤 波 器 滤波 特性 的 前 面 zx 可 
图 。 其 作用 与 理想 低 通 滤波 器 相反 , 它 将 小 于 D。 的 频 


率 (半径 为 D, 的 圆 内 ) 完 全 截止 ,而 大 于 Du 的 频率 ( 圆 外 --------- 
外 的 频率 ) 则 可 以 全 部 无 衰减 通过 。 理 想 高 通 滤波 器 
也 不 能 通过 电子 器 件 实现 。 
下 例 为 数字 图 像 的 理想 高 通 滤波 实验 。 D, po 
例 6-3: 数字 图 像 理想 高 通 滤波 实验 曾 6.8 着 直 高 通过 区 时 宰 画 


如 图 6-9 所 示 是 理想 高 通 滤 波 消除 噪声 的 实例 。 
图 6-9(a) 为 原始 图 像 , 图 6-9(b) 为 对 原始 图 像 进行 理想 高 通 滤波 的 结果 ,图 6-9(c) 为 高 通 滤 
波 器 三 维 图 。 由 于 对 原始 图 像 滤 除了 低频 信号 ,因此 ,图 6-9(b) 仅 余下 高 频 边 缘 信 号 。 半 
径 参 数 不 同 , 滤 波 效 果 不 一 样 。 


(b) 高 通 滤波 结果 


(c) 高 通 滤波 器 三 维 图 
图 6-9 理想 高 通 滤波 消除 噪声 


理想 高 通 滤波 MATLAB 代码 如 下 : 
% 理想 高 通 滤波 程序 


clos 

clear all; 

I= imread( 'cameraman. tif'); 
subplot(221), 


imshow(I); 
title( "原始 图 像 ); 
s= fftshift(fft2(1)); 
subplot(223), 
imshow(abs(s), []); 
title( ' 图 像 传 里 叶 变换 频谱 '); 
subplot(224), 
imshow( log(abs(s)), []); 
title( "图 像 传 里 叶 变 换取 对 数 的 频谱 '); 
[a,b] = size(s); 
a0 = round(a/2); 
bo = round(b/2); 
d=10; 
p=0.2; 
q=0.5; 
for i=1:a 
for j= 1:b 
distance= sqrt((i 一 a0)^2+ (j 一 b0)^2)7 
if distance<=d h=0; 
else h=1; 
end; 
s(i,j)= (p+qxh)*s(i,j); 
end; 
end; 
s=uint8(real(ifft2(ifftshift(s)))); 
subplot(222), 
imshow( s); 
title( ' 高 通 滤 波 结 果 图 像 '); 
I= imread( 'cameraman. tif'); 
[£1, £2] = freqspace( size(I), 'meshgrid'); 
Hd= ones(size(I) ); 
r= sqrt(f1.^2+ f2.^2); 
Hd(r<0.2)=0; 
figure 
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surf (Hd, Facecolor', 'interp', ‘Edgecolor', none', 'Facelighting', ‘phong'); % title( 理想 高 通 滤波 器 '); 


6.2.2 巴特 沃 斯 高 通 滤 波 器 
巴特 沃 斯 高 通 滤波 器 的 传递 函数 为 


H(u,v) = L 


Du 
D(u,v) 
式 中 ,Du 为 滤波 器 的 截止 频率 ; n 为 滤波 器 的 阶 次 。 
巴特 沃 斯 高 通 滤波 器 滤波 性 能 的 剖面 图 如 图 6-10 所 
示 。 截 止 频率 D, 的 取 值 方法 与 巴特 沃 斯 低 通 滤波 器 相 
似 , 该 滤波 其 在 通过 频率 与 截止 频率 之 间 也 没有 明显 的 不 
连续 性 ,图 像 增 强 后 振 铃 效应 不 明显 。 
与 巴特 沃 斯 低 通 滤波 器 类 似 , 一 般 情况 下 , 取 HC,v) 
下 降 至 最 大 值 的 1/2 时 的 D(w,v) 为 截止 频率 D,。。 实 际 
应 用 中 ,有 时 也 取 五 (zx,u) 下 降 至 最 大 值 的 0. 707 时 的 


rT 


(6-10) 


Hlu, v) 
1 


J i , 
0 1 2 3 Dos 
Do 


6-10 巴特 沃 斯 高 通 滤波 器 剖面 图 
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D(u,v) 作 为 截止 频率 D, 。 这 时 其 传递 函数 为 
1 


Hu 一 (6-11) 
1+ Wi—D [pri] 
6.2.3 指数 高 通 滤波 器 
H(usv) = e [rts]" (6-12) 


其 截止 频率 D, 的 取 值 与 指数 低 通 滤波 器 相似 ,其 特性 曲线 剖面 图 如 图 6-11 所 示 。 
6.2.4 梯形 高 通 滤波 器 


梯形 高 通 滤波 器 的 传递 函数 为 
出 D(u,v) > Du 
HG = 1 D:<Dow <D, (6-13) 
0 D(u,v) = DD 
如 图 6-12 所 示 为 梯形 高 通 滤 波 器 滤波 性 能 剖面 示意 图 。 
Hlu, v) 
1 Hlu, v) 
1 
0 1 2 3 Dv) ! = 
Do Di Do Du vu) 
图 6-11 指数 高 通 滤波 器 剖面 图 图 6-12 梯形 高 通 滤 波 器 剖面 图 


6.3 带 通 和 带 阻 滤波 


图 像 处 理 中 ,有 时 需要 增强 的 信息 或 抑制 的 信息 既 不 是 图 像 中 的 高 频 成 分 也 不 是 低频 
成 分 ,而 是 在 一 个 有 限 的 频带 范围 内 。 这 时 ,无论 低 通 滤 波 器 还 是 高 通 滤波 器 都 不 能 完全 满 
足 使 用 需求 ,而 需要 采用 带 通 或 带 阻 滤波 器 。 

6.3.1 带 通 滤波 器 


所 谓 带 通 滤波 器 ,是 指 允 许 一 定 频率 范围 内 的 信号 通过 而 阻止 其 他 频率 范围 内 的 信号 
通过 的 滤波 器 。 理 想 的 带 通 滤波 器 的 传递 函数 为 
0 Dlu.v) =D, 二 有 


H(usv) = 41 Di 一 多 <DGusv) <D,+ 光 (6-14) 


0 Doo) Di 十 字 


到 
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式 中 ,vw 为 通 带 宽度 ; D。 为 通 带 中 心 频率 ; D(u,v) 表 示 从 点 (u,v) 到 频带 中 心 (uo ,vo) 的 距 
离 , 即 
D(u,v) = Vu— uw) tv— wv) (6-15) 
理想 带 通 滤波 器 的 特性 剖面 图 如 图 6-13 所 示 。 


6.3.2 带 阻 滤波 器 


带 阻 滤波 器 的 功能 是 可 以 对 一 定 频率 范围 内 的 信号 进行 完全 衰减 ,而 容许 其 他 频率 范 
围 内 的 信号 通过 。 理 想 的 带 阻 滤波 器 的 传递 函数 为 
1 Dl(u,v) < ow 
H(u,v) = 0 wi < Dusv) < ws (6-16) 
1 D(u,v) 三 
式 中 ,ze ,rwz 分 别 为 阻 带 开 始 和 结束 的 频率 , 即 
Dueyo) = Vt (6-17) 
理想 带 阻 滤波 器 的 特性 剖面 图 如 图 6-14 所 示 。 


Hlu, v) | H(u, v) 
| 国 | | | 
上 条 生 一 


0 w Du v) 2 D(u, v) 


图 6-13 理想 带 通 滤波 器 的 特性 剖面 图 图 6-14 理想 带 阻 滤波 器 的 特性 剖面 图 


6.4 同 态 滤波 


有 一 类 特殊 的 非 线 性 系统 , 它 遵 从 广义 的 释 加 原理 。 在 数学 上 ,这 类 系统 用 输入 和 输出 


的 矢量 空间 之 线性 变换 来 表示 , 称 为 同 态 系统 。 同 态 滤波 是 一 种 非 线性 滤波 方法 , 它 基 于 一 
个 简单 的 亮度 成 像 模 型 。 


6.4.1 同 态 滤波 原理 


在 进行 图 像 处 理 及 应 用 时 ,有 时 会 遇 到 这 样 一 类 图 像 ,其 动态 范围 很 大 ,而 使 用 者 感 兴 
趣 的 图 像 区 域 的 灰 度 值 低 、 亮 度 较 暗 ,图 像 细 节 不 清晰 、 难 以 辨认 ,而 且 采 用 一 般 的 灰 度 级 线 
性 变换 处 理 效果 不 好 。 这 时 可 以 考虑 采用 非 线 性 的 同 态 滤波 (homomorphic filtering) 方 法 
对 图 像 进 行 处 理 。 

本 章 前 面 介 绍 的 线性 滤波 器 对 消除 加 性 噪声 很 有 效 ,但 如 果 图 像 的 噪声 是 非 线性 的 乘 
性 噪声 ,如 采用 发 光源 照明 成 像 时 ,其 中 目标 源 的 反射 以 相 乘 的 形式 对 成 像 做 出 贡献 ,此 时 
可 以 使 用 同 态 滤波 。 
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图 像 的 同 态 滤波 属于 频 域 处 理 范畴 ,其 作用 是 对 图 像 的 亮度 范围 进行 压缩 或 调整 ,消除 
图 像 上 存在 的 照明 不 均 的 问题 ,增强 图 像 暗 区 的 细节 信息 ,同时 又 不 损失 亮 区 的 图 像 细 节 ， 
从 而 实现 对 图 像 的 对 比 度 进行 增强 。 

简 而 言 之 , 同 态 滤波 是 利用 广义 盔 加 原理 对 系统 进行 滤波 ,是 一 种 频 域 滤波 和 灰 度 变换 
结合 的 图 像 处 理 方法 , 它 以 图 像 的 照度 /反射 率 模 型 作为 频 域 处 理 的 基础 ,通过 压缩 图 像 亮 
度 范 围 和 增强 对 比 度 来 改善 图 像 质 量 。 使 用 这 种 方法 处 理 图 像 非常 符合 人 眼 对 于 亮度 响应 
的 非 线 性 特性 ,避免 了 直接 对 图 像 进 行 傅 里 叶 变 换 时 产生 的 失真 。 

同 态 滤波 的 基本 原理 : 将 像 元 灰 度 值 看 作 照度 和 反射 率 两 个 组 分 的 产物 。 由 于 照度 相 
对 变化 很 小 ,可 以 看 作 图 像 的 低频 成 分 ,反射 率 则 是 高 频 成 分 。 通 过 分 别处 理 照 度 和 反射 率 
对 像 元 灰 度 值 的 影响 ,实现 增强 暗 区 细节 特征 的 目的 。 


6.4.2 同 态 滤 波 实现 方法 


应 用 同 态 滤波 消除 图 像 噪声 ,应 先 利用 对 数 变换 将 乘 性 噪声 转化 为 加 性 噪声 ,通过 线性 
滤波 器 消除 噪声 后 再 进行 非 线性 的 指数 反 变换 得 到 无 噪声 的 原始 图 像 。 同 态 滤 波 处 理 的 基 
本 流程 如 图 6-15 所 示 。 


CD 


a(x,») 


ln -| FFT -=| H(u,v) 上 一 IFFT -| exp 


图 6-15 同 态 滤波 流程 图 


图 6-15 中 ,f(z,y) 表 示 原 始 图 像 ;， g(x,y) 表 示 处 理 后 的 图 像 ; ln 代表 对 数 运算 ; FFT 
代表 傅 里 叶 变 换 ; H(u,v) 表 示 同 态 滤波 ; IFFT 代表 傅 里 叶 首 变换; exp 代表 指数 运算 。 
有 具体 过 程 如 下 : 

(1) 对 /(z,y) 进 行 对 数 变 换 。 

一 般 自 然 景 物 的 图 像 FCz,y) 可 由 照明 (illumination) 函数 i(zx,y) 和 反射 (reflectance) 
函数 r(xz,y) 的 乘积 表示 。i(z,y) 描 述 景 物 的 照明 ,与 景物 无 关 ; r(z,y) 包 含 景物 的 细节 ， 
与 照明 无 关 。 

即 

zy) = i(r yr(r,y) 
0<ilz,y) < 0<r(r,y) < 1 《6-18 

由 于 i 与 函数 二 者 相 乘 , 先 变 换 到 频 域 再 对 其 进行 处 理 ,因此 对 上 式 取 对 数 得 

lInf(zx,y) = lni(zsy) t+ lnr(z,y) 

(2) 对 上 式 进 行 傅 里 叶 变 换 。 

Fl(u,v) = I(usv) + R(u,v) (6-19) 

I(u,v) 照 明 函 数 在 空间 上 变化 缓慢 ,其 频谱 特性 集中 在 低频 段 ; R(u.v) 反 射 函 数 的 频 
谱 集中 在 高 频段 ,景物 本 身 具 有 较 多 的 细节 和 边缘 ,反射 函数 描述 的 景物 ,反映 图 像 的 细节 


内 容 , 其 频率 处 于 高 频 区 域 。 
(3) 采用 频 域 增强 函数 及 (w,v) 处 理 F(u,v)。 
Hl(us Fu,v) = Hua)Iuv) + Hu Ru,v) (6-20) 


车 图 像 照 明 不 均 , 则 图 像 内 各 部 分 的 平均 亮度 会 有 起 伏 ,这 时 图 像 暗 区 的 细节 较 难 分 


出 
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辨 ,因此 ,需要 消除 这 种 不 均匀 性 。 同 态 滤 波 方法 是 压缩 照明 函数 的 灰 度 范围 , 即 在 频 域 前 
弱 照 明 函 数 的 成 分 ,同时 增强 反射 函数 的 频谱 成 分 ,因此 增加 了 反映 图 像 对 比 度 的 反射 函数 
的 比重 。 因 而 使 图 像 暗 区 的 图 像 细 节 信息 得 以 增强 ,而 且 还 尽 可 能 地 保持 了 亮 区 的 图 像 细 
节 。 通 过 与 传递 函数 同 态 滤 波 器 互 (vw,v) 相 乘 ,低频 段 被 压缩 ,而 高 频段 被 扩展 。 

(4) 进行 IFFT 变换 。 

进行 傅 里 叶 反 变换 得 到 对 应 空间 域 的 表达 式 为 


jir(zyy) = hx,y) th (rx,y) (6-21) 
根据 上 式 可 以 看 出 ,增强 以 后 的 图 像 分 别 对 应 照度 分 量 和 反射 分 量 两 部 分 ,图 像 由 两 章 
分 全 加 而 成 。 
(5) 对 上 式 取 指数 函数 。 
g(Czyy) 一 exp[Lhr(zyy)] = exp[Lhi(z,y) th,(z,y)] (6-22) 


根据 不 同 的 图 像 特性 和 需要 ,选用 不 同 的 甩 (u,v) ,可 得 到 比较 理想 的 滤波 结果 。 对 于 
细节 对 比 度 差分 辨 不 清 的 图 像 采 用 同 态 滤波 器 处 理 后 ,图 像 的 亮度 比较 均匀 ,细节 得 到 一 
定 的 增强 。 


6.4.3 同 态 滤波 的 应 用 


例 6-4: 数字 图 像 同 态 滤波 效果 实验 
根据 同 态 滤 波 算法 的 原理 ,其 MATLAB 程序 代码 如 下 : 


clear; 

close all; 

[name, path] = uigetfile( 'pout. bmp'); 

file= strcat(path, name); 

[X,map] = imread(file); 

X= double(X); 

I= rgb2hsv(X); 

H=1(:,:,1); 

S=I1(:,:,2); 

V=I(:,:,3); 

figure; 

imshow( 'pout. bmp'); 

title( ' 原 始 图 像 '); 

名 构造 一 个 高 斯 滤波 器 

f_high=1.0; 

£_low= 0.8; 得 到 一 个 高 斯 低 通 滤波 器 
gauss low filter = fspecial( 'gaussian’, [7 7], 1.414); 

matsize= size(gauss_low filter); 

s# 同 态 滤 波 滤 除 高 频 部 分 ,将 低 通 滤波 器 转换 为 高 通 滤 波 器 

%f_high 和 f_low 为 高 通 滤波 器 形态 参数 

gauss high _ filter = zeros(matsize); 

gauss_high filter(ceil(matsize(1,1)/2) ,ceil(matsize(1,2)/2))=1.0; 
gauss_high filter =f high*x gauss high filter— (f_high—f low) * gauss low filter; 
名 对 数 变 换 将 人 射 光 和 反射 光 分 开 

log_img = log(double(V) + eps); 

名 将 高 斯 高 通 滤波 器 与 对 数 转换 后 的 图 像 卷 积 

high log part = imfilter(log img, gauss high filter, 'symmetric', 'conv'); 


170 所 数字 图 像 处 理 及 应 用 


名 指数 exp 变换 

high part = exp(high log part); 
minv = min(min(high part)); 
maxv = max(max(high part)); 
结果 图 像 

temp = (high part ~— minv)/(maxv — minv); 
S= adapthisteq(S) * 2.1; 
HSV3(:,:,1)=H; 

HSv3(: :12) = 8; 

HSV3( :, :, 3) = temp; 

rgb2 = hsv2rgb(HSV3); 

figure; 

imshow( rgb2); 
title( ' 同 态 滤波 结果 ') ; 


同 态 滤波 程序 运行 结果 如 图 6-16 所 示 。 


} Figure 1 

File Edit Vien Insert Tools Desktop Windon Help 

DB 名 NIQAQVDIAR0DB a 
原始 图 像 


(a) 原始 图 像 


使 用 MATLAB 分 析 与 实现 


转换 到 RGB 空间 


Figure 2 
Eile Bdit Yiew Insert Tools Desktep Window Help 


DNIQAYDR0EIea 
同 态 滤波 图 像 


(b) 同 态 滤波 结果 


图 6-16 同 态 滤波 图 像 处 理 


习题 


1. 图 像 频 域 增强 的 原理 是 什么 ? 
2. 试 阐述 低 通 滤波 的 原理 和 作用 。 


3. 根据 空域 滤波 增强 和 频 域 滤波 增强 的 基本 理论 ,分析 空域 滤波 中 的 邻 域 均值 滤波 和 


低 通 滤波 方法 的 特点 。 


4. 试 比较 二 维 低 通 巴特 沃 斯 滤波 器 和 二 维 低 通 梯形 滤波 器 的 特点 有 何 异 同 。 


5. 简 述 高 通 滤 波 的 原理 及 特点 。 


网 
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6. 挑选 一 幅 图 像 ,编写 MATLAB 频 域 滤波 程序 ,实现 如 下 功能 : 

(1) 对 图 像 进行 低 通 滤波 。 

(2) 对 图 像 进行 高 通 滤波 。 

(3) 观察 低 通 、 高 通 滤波 的 实验 结果 ,分 析 两 种 滤波 方法 的 功能 和 应 用 范围 。 

7. 简要 分 析 频 域 带 通 滤波 的 应 用 条 件 。 

8. 选择 一 幅 图 像 ,编写 MATLAB 程序 对 其 进行 带 通 和 带 阻 滤波 ,并 分 析 滤 波 效 果 。 
9. 试 阐述 同 态 滤波 的 原理 和 实现 过 程 。 

10. 选择 一 幅 图 像 进行 同 态 滤波 ,分 析 同 态 滤 波 的 作用 与 效果 。 


a 彩色 图 像 处 理 


CHAPTER 7 


随 着 信息 技术 和 人 工 智 能 技术 的 发 展 ,在 图 像 信 息 中 ,彩色 图 像 占 据 的 比例 越 来 越 高 ， 
其 应 用 已 越 来 越 广泛 。 人 类 视觉 对 灰 度 级 数 的 辨别 能 力 有 限 ,而 对 彩色 的 识别 能 力 强 , 因 
此 ,与 灰 度 图 像 相 比 ,彩色 图 像 携带 了 更 多 的 特征 和 可 视 化 信息 ,彩色 图 像 处 理 已 成 为 图 像 
处 理学 科 的 一 个 重要 的 研究 分 支 。 

本 章 首先 介绍 人 眼 视 觉 系统 及 其 特点 ,然后 介绍 计算 机 系统 的 颜色 模型 ,包括 面向 硬件 
设备 的 颜色 模型 (RGB 和 CMYK) 和 面向 视觉 特性 的 颜色 模型 (HSI、YUV、HSV 和 Lab)， 
最 后 介绍 彩色 图 像 处 理 的 基本 原理 和 方法 。 


7.1 人 眼 的 视觉 特性 


人 类 在 长 期 的 进化 过 程 中 ,形成 了 特有 的 视觉 特性 。 人 类 视觉 系统 是 世界 上 最 好 的 图 
像 处 理 系统 ,即便 如 此 ,人 有 眼 也 不 是 完美 的 。 人 眼 视 觉 系统 对 图 像 的 认 知 是 非 均 匀 , 非 线性 
的 ,并 不 是 对 图 像 中 的 任何 变化 都 能 感知 。 例 如 ,在 一 定 范围 内 ,人 有 眼 不 能 觉察 到 图 像 系数 
的 量化 误差 所 产生 的 图 像 差 异 。 因 此 , 若 图 像 编 码 方法 能 利用 人 类 视觉 系统 的 这 些 特 点 , 则 
可 以 得 到 更 高 压缩 比 的 方法 。 对 人 眼 视觉 特性 的 深入 研究 以 及 基于 视觉 特性 而 建立 的 各 种 
数学 模型 ,一 直 是 数字 图 像 各 种 压缩 算法 的 基础 。 


7.1.1 人 有 眼 的 结构 


人 的 眼睛 主要 由 视网膜 瞳孔、 角膜 .晶状体 等 组 成 ,如 图 7-1 所 示 。 其 中 视网膜 是 人 有 眼 
感受 光 的 部 分 ,视网膜 就 像 一 架 照 相机 的 感光 底片 ,专门 负责 感光 成 像 。 边 缘 部 位 杆 状 细胞 
占 多 数 , 中 央 部 位 锥 状 细胞 占 多 数 。 这 两 种 细胞 对 光 的 感受 特性 分 工 不 同 , 杆 状 细胞 对 光 的 
感受 性 比 锥 状 细胞 要 高 。 因 此 , 若 视觉 亮度 大 约 在 10“ 一 10“cd/m 的 照度 范围 ,只 有 杆 状 
细胞 在 工作 ,这 种 状态 被 称 为 暗 视觉 。 当 亮度 达到 10cd/m 时 锥 状 细胞 开始 工作 , 当 亮 度 在 
10 习 一 10cd/m? 时 , 杆 状 细胞 和 锥 状 细胞 同时 起 作用 ,这 种 视觉 状态 被 称 为 中 介 视 觉 。 杆 状 
细胞 感受 光 , 锥 状 细胞 感受 颜色 ,因此 ,只 有 在 照度 较 高 的 条 件 下 ,人 的 视觉 才 会 有 良好 的 颜 
色 感 。 

由 于 杆 状 细胞 和 锥 状 细胞 是 在 神经 系统 的 综合 控制 下 而 起 作用 ,使 得 人 眼 具 有 视觉 适 
应 等 一 系列 独 有 的 特性 。 视 觉 适应 是 视觉 器 官 的 感觉 随 外 界 亮 度 的 刺激 而 变化 的 过 程 , 即 
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房 水 晶状体 


(a) (b) 
图 7-1 人 了 眼 的 组 成 


现在 和 过 去 呈现 的 各 种 亮度 .光谱 分 布 . 视 角 的 刺激 下 ,视觉 系统 状态 的 变化 ,有 时 也 指 这 一 
过 程 达到 的 最 终 状态 。 视 觉 适应 的 机 制 包括 视 细胞 或 神经 活动 的 重新 调整 .瞳孔 的 变化 及 
明 视觉 与 暗 视觉 功能 的 转换 。 

视觉 适应 分 为 明 适 应 和 暗 适 应 , 瞳 适 应 所 需 过 渡 时 间 较 长 , 明 适 应 过 程 较 短 ,一般 为 2 一 
3min。 视 觉 不 会 瞬时 产生 ,也 不 会 瞬时 消失 ,尤其 在 遇 到 高 亮度 的 闪光 后 ,人 了 眼 往往 会 感受 
到 一 连 串 影像 ,以 不 规则 的 强度 和 不 断 降 低 的 频率 正 负 交替 出 现 ,这 种 现象 被 称 为 后 像 。 人 
的 眼睛 突然 遇 到 强 光 照射 时 ,在 之 后 一 段 时 间 内 ,会 被 一 个 黑 影 困扰 。 因 此 , 强 光 对 人 眼 视 
觉 具 有 一 定 的 危害 。 使 人 眼 感 到 不 舒服 的 还 有 眩光 ,眩光 也 可 分 为 两 类 ,一 是 失 能 眩光 ,二 
是 不 舒适 眩光 。 不 舒适 眩光 会 使 人 产生 烦躁 的 感觉 , 失 能 眩光 会 导致 眼 部 疲劳 ,工作 效率 降 
低 ,甚至 可 致 短暂 致 育 。 光 源 的 发 光 颜色 与 温度 有 关 , 如 白炽 灯 , 灯 丝 温度 低 ,发 出 红 光 , 温 
度 高 ,发 出 白光 。 当 光源 照射 到 物体 上 时 ,该 物体 色彩 与 阳光 照射 时 的 色彩 不 完全 一 致 ,有 

- 定 的 失真 度 。 

人 有 眼 视觉 特性 表明 ,良好 的 照明 质量 ,对 提高 学 习 和 工作 效率 及 减少 视觉 疲劳 具有 很 重 
要 的 作用 。 适 合 人 类 视觉 的 照明 光源 ,首先 是 照度 的 均匀 性 ,不 均 的 照度 容易 引起 视力 疲 
劳 ,这 就 要 求 室内 的 最 大 和 最 小 照度 与 平均 照度 之 差 的 绝对 值 不 大 于 平均 照度 的 1/6。 其 
次 ,要 考虑 照度 的 稳定 性 , 若 照 度 波动 大 ,特别 是 每 秒 20 次 下 的 严重 波动 ,对 眼睛 危害 很 大 ， 


7.1.2 人 眼 视觉 模型 

人 类 视觉 系统 的 工作 原理 类 似 于 光学 系统 ,但 它 不 是 普通 意义 上 的 光学 系统 ,还 受到 神 
经 系统 的 调节 ,因此 远 比 光学 系统 复杂 。 为 了 对 人 类 视觉 系统 进行 研究 与 分 析 , 可 以 用 光学 
系统 的 一 些 原理 来 解释 人 眼 的 一 些 视觉 特性 。 

目前 认为 ,人 眼 视 觉 模型 是 一 个 低 通 -对 数 -高 通 模型 .如 图 7-2 所 示 。 


光 信号 一 | 低 通 滤波 -=| ”对 数 ”fe 高 通 滤波 Fe 生物 电信 号 


图 7-2 低 通 -对 数 -高 通 人 眼 视觉 模型 
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(1) 第 一 阶段 ,是 人 眼 接收 光 信 号 的 过 程 。 在 这 一 阶段 ,由 于 人 了 眼 品 状 体 光学 偏差 , 视 
觉 系 统 的 上 限 频 率 起 到 作用 ,人 有 眼 对 高 频 变 化 不 敏感 ,相当 于 对 信号 进行 低 通 滤波 。 

(2) 第 二 阶段 ,是 视觉 细胞 响应 光 信号 的 过 程 。 由 于 人 有 眼 视觉 系统 的 生物 结构 ,视觉 的 
感受 亮度 和 空间 的 客观 亮度 关系 不 能 近似 为 数学 上 的 线性 函数 关系 ,而 与 非 线 性 的 对 数 函 
数 关系 非常 接近 。 

(3) 第 三 阶段 ,是 视神经 细胞 的 解析 过 程 阶段 。 由 于 视神经 细胞 的 侧 向 抑制 作用 ,人 有 眼 
对 低频 光 不 敏感 ,该 过 程 等 效 于 高 通 滤波 。 

根据 上 述 模型 ,人 眼 观察 图 像 时 表现 出 以 下 几 个 方面 的 特性 : 

(1) 从 空间 频率 域 看 ,人 了 眼 是 一 个 线性 低 通 滤波 系统 ,分 辨 景物 的 能 力 是 有 限 的 。 由 于 
瞳孔 有 一 定 的 几何 尺寸 和 一 定 的 光学 像 差 ,视觉 细胞 有 一 定 的 大 小 ,所 以 人 眼 的 分 辩 率 不 能 
是 无 穷 的 ,HVS( 人 有 眼 视觉 系统 ) 对 太 高 的 频率 不 敏感 。 

(2) 人 眼 对 亮度 的 响应 具有 非 线性 对 数 特 性 ,以 提高 其 亮度 的 动态 范围 。 由 于 人 眼 对 
亮度 响应 的 这 种 非 线性 特性 ,在 平均 亮度 大 的 区 域 , 人 眼 对 灰 度 小 幅 变化 不 敏感 。 

(3) 由 于 人 眼 受 神经 系统 的 调节 ,从 空间 频率 的 角度 来 说 ,人 眼 视觉 系统 不 仅 是 一 个 线 
性 系统 ,而 且 是 一 个 具有 带 通 特性 的 系统 。 由 信号 分 析 的 理论 ,人 有 眼 视觉 系统 对 信号 进行 加 
权 求 和 运算 ,相当 于 使 信号 通过 一 个 带 通 滤波 器 ,结果 会 使 人 眼 产 生 一 种 边缘 增强 感觉 一 一 
侧 抑制 效应 。 人 眼 对 亮度 信号 的 空间 分 辩 率 大 于 对 色 度 信号 的 空间 分 辩 率 。 

(4) 图 像 的 边缘 信息 对 视觉 很 重要 ,特别 是 边缘 的 位 置信 息 。 人 有 眼 容易 感觉 到 边缘 的 
位 置 变化 ,而 对 于 边缘 的 灰 度 误差 ,人 有 眼 并 不 敏感 。 

由 于 人 眼 系统 的 复杂 性 ,实际 上 ,人 眼 的 视觉 特性 也 是 一 个 多 信道 (multichannel) 模 型 ， 
或 者 说 ,具有 多 频 信道 分 解 特性 (mutifrequency channel decompositon)。 


7.1.3 人 类 视觉 特性 

在 宽泛 的 电磁 波谱 中 ,人 有 眼 仅仅 可 感知 其 中 很 窄 范围 的 一 段 波长 ,这 一 段 电磁 波谱 称 为 
可 见 光 , 即 可 见 光 是 指 电磁 波谱 中 人 眼 可 以 感知 的 部 分 。 人 眼 可 以 感知 的 波长 范围 如 
图 7-3 所 示 。 由 于 人 眼 结构 的 复杂 性 和 个 体 差异 ,可见 光谱 没有 精确 的 波长 范围 ,一 般 认 为 
波长 在 380 一 780nm 范围 的 光 为 可 见 光 。 


7 射线 | ”X 射 线 | 紫外 线 | | 红外 线 | 雷达 FMTV | 短波 |AM 
WO 1010. -IO 105 10 102 1 102 10+ 
Be Sosa 波长 /m 
a 可 见 光 se 
400nm 500nm 600nm 700nm 


图 7-3 光谱 与 可 见 光谱 的 分 布 


即便 对 于 380 一 780nm 波长 范围 的 可 见 光 ,人 眼 对 不 同 波长 的 光 具 有 不 同 的 敏感 程度 ， 
这 一 特性 称 为 人 眼 的 视 敏 特 性 。 描 述 人 眼 视 敏 特性 的 物理 量 有 视 敏 函数 和 相对 视 敏 函数 。 
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(1) 视 敏 函数 。 在 相同 亮度 感觉 的 条 件 下 ,不 同 波长 的 光 辐 射 功率 的 倒数 称 为 视 敏 函 
数 , 即 


上 
2 


(2) 相对 视 敏 函数 。 相 对 视 敏 函数 是 基于 比值 定义 的 ,大 量 的 实验 研究 表明 ,人 了 眼 对 波 
长 为 555nm 的 光 最 敏感 , 任 一 波长 的 光 的 视 敏 函数 与 最 大 视 敏 函 数值 K(555) 的 比值 称 为 
相对 视 敏 函数 , 即 


k(4) = = 


KO)_ KGQ) _ P,(555) 
Kw  K(555) P,Q) 


研究 表明 , 视 敏 函数 曲线 的 最 大 值 位 于 555nm 处 , 当 光 线 微 弱 向 左 偏 移 至 最 大 值 为 
507nm 处 ,HVS 就 相当 于 带 通 滤波 器 ,这 就 表明 人 眼 对 亮度 变化 比较 敏感 。 

人 有 眼 对 于 蓝光 的 视觉 灵敏 度 要 比 红 光 和 绿 光 低 得 多 ,人 眼 三 种 锥 状 细胞 相对 视 敏 函数 
曲线 如 图 7-4 所 示 。 三 条 曲线 的 峰值 比 为 R:G: B=0.54 :0.575: 0.053( 蓝 光 放 大 20 
倍 )。 三 条 曲线 有 相当 一 部 分 是 重 双 的。 正常 观察 条 件 下 ,人 有 眼 得 到 的 是 合成 视觉 特性 ,不 
能 感受 到 三 者 各 自 的 数值 ,根据 三 者 的 比例 ,HVS 感知 彩色 的 色调 和 饱和 度 , 由 三 者 之 和 确 
定 光 的 总 亮度 和 颜色 。 


VO) 


(7-2) 


波长 


图 7-4 三 种 锥 状 细胞 相对 视 敏 函数 曲线 


长 期 以 来 ,通过 对 人 有 眼 视觉 现象 的 实验 和 研究 ,发 现 人 眼 的 视觉 特性 具有 对 比 灵敏 度 、 
分 辨 率 、 马 赫 带 效应 、 视 觉 掩盖 效应 等 很 多 特点 ,这 些 特性 可 以 直接 或 间接 地 用 于 改善 图 像 
与 视频 信息 的 处 理 。 如 何 充分 利用 人 眼 的 视觉 特性 ,已 成 为 现代 编码 技术 中 首先 要 考虑 的 
一 个 基本 问题 。 

1) 对 比 灵敏 度 

在 可 见 光 范 围 内 ,人 有 眼 对 光 强 变化 的 响应 是 非 线性 的 ,通常 将 人 有 眼 主观 感受 上 可 辨别 的 
亮度 差 所 需 的 最 小 光 强 差 值 称 为 亮度 的 可 见 度 国 值 。 也 就 是 说 , 当 光 强 了 从 某 一 值 开始 逐 
浙 增 大 ,在 一 定 幅度 内 人 眼 感 觉 不 到 亮度 的 变化 ,必须 变化 到 一 定 增 量 AI 时 ,人 有 眼 才能 感 
觉 到 亮度 发 生 了 变化 ,AI/AT 称 为 对 比 灵 敏 度 。 因 此 如 果 恢 复 图 像 的 误差 低 于 对 比 灵 人 敏 度 ， 
人 眼 就 感觉 不 到 图 像 质量 有 变化 。 人 有 眼 对 于 运动 图 像 的 对 比 灵 敏 度 与 时 间 轴 上 信息 的 变化 
速度 有 关 , 随 着 时 间 轴 变化 频率 的 增加 ,人 有 眼 所 能 感受 到 的 图 像 信息 的 误差 阔 值 呈 上 升 趋 
势 ,视觉 上 的 这 种 动态 对 比 灵 敏 度 特性 表现 为 图 像 序列 之 间 相 互 掩盖 效应 。 在 图 像 编码 上 ， 
可 见 度 贱 值 和 掩盖 效应 对 量化 器 的 设计 具有 重要 意义 ,利用 这 一 视觉 特性 ,在 图 像 的 边缘 可 
以 容忍 较 大 的 量化 误差 ,使 量化 级 数 减 少 ,从 而 提高 图 像 的 编码 效率 。 
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2) 分 辨 率 
当空 间 平面 上 两 个 黑 点 不 断 靠近 到 某 一 距离 时 . 距 黑 点 一 定 距 离 的 观察 者 将 无 法 区 分 ， 
这 说 明 人 眼 分辨 景 物 细节 的 能 力 是 有 限 的 ,可 区 分 的 最 小 距离 就 是 分 辨 率 。 研 究 表 明 , 人 类 
视觉 的 分 辩 率 具有 如 下 特点 : 当 照度 太 强 、 太 弱 , 或 背景 亮度 太 强 时 ,分 辨 率 降 低 ; 当 目标 
快速 运动 时 ,分 辩 率 降低 。 对 彩色 细节 的 分 辩 率 比 对 亮度 细节 的 分 辩 率 低 , 如 果 黑 白 分 辩 率 
为 1, 则 黑 红 为 0.4, 绿 蓝 为 0. 19。 

3) 马赫 带 效应 

马赫 带 效 应 (Mach band effect) 是 1868 年 由 奥地利 物理 
学 家 E. 马赫 发 现 的 一 种 明度 对 比 现象 , 它 是 一 种 主观 的 边缘 
对 比 效应 。 所 谓 马 赫 带 现象 ,是 指 人 眼 观 察 两 块 亮度 不 同 的 区 
域 时 ,边界 处 的 亮度 对 比 会 感觉 到 更 大 ,使 轮廓 表现 得 特别 明 
显 ,如 图 7-5 所 示 。 

马赫 带 效应 的 产生 是 人 类 的 视觉 系统 特性 造成 的 ,HVS ”图 7-5 马赫 带 效应 示意 图 
主观 感受 在 亮度 变化 之 处 出 现 虚幻 的 明亮 或 黑暗 的 条 纹 。 生 
理学 对 马赫 带 效应 的 解释 是 : 人 类 的 视觉 系统 有 增强 边缘 对 比 度 的 特性 。 当 亮度 发 生 跃 变 
时 ,会 产生 边缘 增强 的 感觉 ,视觉 上 会 感到 亮 侧 更 亮 , 暗 侧 更 暗 。 人 类 视觉 的 马赫 带 效应 会 
导致 局 部 半 值 效应 , 即 在 边缘 的 亮 侧 ,靠近 边缘 像素 的 误差 感知 阔 值 比 远离 边缘 阔 值 高 3 一 
4 倍 ,边缘 掩盖 了 其 邻近 像素 ,因此 对 靠近 边缘 的 像素 编码 误差 可 以 适度 大 一 些 。 


7.2 计算 机 的 颜色 模型 


自然 界 是 一 个 具有 丰富 色彩 的 世界 ,不 仅 不 同 的 物体 有 不 同 的 颜色 ,而 且 相 同 的 颜色 还 
具有 不 同 的 色 度 和 饱和 度 。 计 算 机 系统 的 彩色 模型 又 称 为 彩色 空间 或 彩色 坐标 系 。 图 像 处 
理 中 的 颜色 模型 有 很 多 种 ,常用 的 颜色 模型 有 RGB 颜色 模型 .HSI 颜色 模型 HSV 颜色 模 
型 .CMYK 颜色 模型 .YUV 颜色 模型 Lab 颜色 模型 。 


7.2.1 面向 硬件 的 彩色 模型 


面向 硬件 的 颜色 模型 主要 包括 RGB 和 CMYK 颜色 模型 。 由 于 这 类 颜色 模型 面向 硬 
件 设备 ,非常 适合 图 像 采 集 输 入 和 图 像 输出 显示 的 场合 使 用 。 

1. RGB 模型 

自 20 世纪 60 年 代 以 来 ,人 类 对 计算 机 的 彩色 表示 进行 了 系统 深入 的 研究 ,科学 研究 表 
明 ,任何 色彩 都 可 以 用 R.G、B 三 种 颜色 按 一 定 的 比例 混合 至 加 实现 。 实 际 上 ,人 有 眼 的 锥 状 
感光 细胞 将 可 见 光 部 分 分 为 R.G、B 三 个 波段 ,因此 R、G、B 又 称 为 三 基色 。 如 图 7-6 所 示 
为 视觉 系统 三 类 锥 状 感光 细胞 的 光谱 敏感 曲线 。 

R.G、B 称 为 人 类 视觉 的 三 基色 ,RGB 彩色 系统 在 日 常生 活 的 应 用 非常 广泛 。 例 如 ,人 
们 常用 的 彩色 打印 机 就 是 通过 红 、 绿 、 蓝 三 色 友 加 在 一 起 打印 ,从 而 显示 出 不 同 的 颜色 ; 彩 
色 照 相 时 ,通过 三 层 不 同 的 摄影 乳剂 合成 获得 真 彩色 图 像 ; 在 计算 机 中 ,每 个 像素 的 颜色 同 
样 是 由 RGB 三 原色 ( 即 三 个 分 量 ) 按 不 同比 例 琶 加 实现 的 ,每 一 分 量 的 亮度 值 的 大 小 限定 在 
一 定 范围 ,如 [0,255]。RGB(0,0,0) 表 示 黑 色 .RGB(255,255,0) 表 示 由 红 绿 释 加 得 到 黄 


出 
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图 7-6 锥 状 感光 细胞 的 电磁 波谱 响应 曲线 
色 , 而 RGB(255,255,255) 表 示 由 红 绿 蓝 秋 加 得 到 白色 。 在 RGB 彩色 空间 的 原点 上 ,三 个 
基色 均 没有 亮度 , 即 原点 为 黑色 ,三 基色 达到 最 高 亮度 时 表现 为 白色 ,如 图 7-7 所 示 。 亮 度 
较 低 的 等 量 的 三 种 基色 产生 灰色 的 基调 ,所 有 这 些 点 均 落 在 彩色 立方 体 的 对 角 线 上 ,该 对 角 
线 被 称 为 灰色 线 。 


青 (cyan) 白 (white) 


蓝 (B) 


黄 (yellow) 


~ 


黑 (black) 红 (R) 
图 7-7 彩色 的 立方 体 表示 


2. CMYK 颜色 模型 

CMYK 表 色 系统 也 是 一 种 常用 的 颜色 表示 模型 。 计 算 机 屏幕 显示 通常 用 RGB 系统 ， 
它 是 通过 三 基色 到 加 来 产生 丰富 多 彩 的 颜色 ,这 种 做 法 通常 称 为 加 色 合 成 法 。 而 在 印刷 工 
业 上 则 通常 用 CMYK 表 色 系统 , 它 是 通过 颜色 相 减 来 产生 其 他 颜色 的 ,所 以 称 这 种 方式 为 
减 色 合 成 法 。 
CMYK 模式 的 原色 为 青色 (cyan) 、 品 红色 (magenta) ,黄色 (yellow) 和 黑色 (black)。 由 
于 CMYK 模式 的 彩色 图 像 文件 比 其 他 彩色 表示 方法 的 文件 要 大 ,占用 了 太 多 的 计算 机 磁 
盘 空 间 和 内 存 , 因 此 数字 图 像 处 理 中 一 般 不 用 CMYK 模式 ,该 模式 一 般 在 彩色 印刷 领域 使 
用 。 在 CMYK 模型 中 ,如 去 除 黑色 ,就 是 CMY 颜色 模型 ,同样 是 基于 减 色 法 合成 彩色 原理 。 


7.2.2 面向 视觉 感知 的 颜色 模型 


面向 硬件 设备 的 颜色 模型 与 人 的 视觉 感知 有 一 定 的 差距 ,使 用 时 不 太 方便 ,最 典型 的 问 
题 是 ,给 定 一 个 彩色 图 像 , 人 眼 难以 确定 其 RGB 分 量 ,这 时 面向 视觉 感知 的 彩色 模型 比较 方 
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便 。 这些 模 型 独立 于 显示 设备 ,与 人 类 颜色 视觉 感知 比较 接近 。 

1. HSI 颜色 模型 

与 RGB 格式 从 物理 和 光学 角度 描述 颜色 不 同 ，HSI 则 是 根据 视觉 的 主观 感觉 对 颜色 
进行 描述 。 研 究 和 实践 均 表 明 , 人 眼 不 能 直接 感觉 红 、 绿 、 蓝 三 色 的 比例 ,只 能 通过 感知 颜色 
的 亮度 、 色 调和 饱和 度 来 区 分 物体 。 在 HSI 彩色 空间 中 ,I 表示 强度 (intensity), 它 决定 了 
像素 点 的 整体 亮度 ,而 不 考虑 色彩 ,而 表征 像素 彩色 信息 的 两 个 参数 是 色 度 (hue) 和 饱和 度 
(Csaturation ) 。 

色 度 HH 表明 颜色 的 种 类 ,而 颜色 是 由 波长 决定 的 ,所 以 彩色 的 色 度 S 表示 该 彩色 最 接 
近 什 么 样 波长 的 光谱 ,不 同 的 波长 显示 出 不 同 的 颜色 ,如 波长 为 0. 55pm 的 呈现 绿色 ,植物 
由 于 叶片 中 含有 叶绿素 ,在 0. 55pm 左右 有 一 个 反射 高 峰 , 使 叶子 看 上 去 呈现 绿色 。 据 研 
究 , 人 有 眼 所 能 分 辩 的 自然 界 的 色 度 大 约 有 120 种 。 

饱和 度 是 表示 颜色 深 、 浅 、 浓 、 淡 程度 的 物理 量 。 例 如 , 同 
是 红色 , 却 有 深 红 和 浅 红 之 分 。HSI 颜色 模型 反映 了 人 的 视 
觉 对 色彩 的 感觉 ,Castleman 博士 在 (数字 图 像 处 理 》 中 用 一 桶 
颜料 作 了 形象 的 注释 : 假设 有 一 桶 纯 红 色 的 颜料 ,其 饱和 度 为 
1, 如 果 摊 入 白色 染料 后 , 则 红色 变 淡 , 即 减少 了 它 的 饱和 度 ， 
随 着 更 多 的 白色 染料 加 入 ,饱和 度 逐 渐 降低 ,直至 变 成 白色 ， 
即 饱 和 度 为 0。 图 像 处 理 中 ,通常 用 一 个 柱 体 坐 标 系 来 表示 
HSI 空间 ,如 图 7-8 所 示 。 

柱 体高 度 表示 强度 分 量 , 柱 体 的 圆 环 表示 色 度 分 量 采 ， 
以 “ 度 ” 为 衡量 单位 , 柱 体 的 半径 表示 饱和 度 分 量 S, 半 径 越 大 ， 
S 越 大 。 具 有 最 高 亮度 和 最 大 饱和 度 的 颜色 位 于 圆柱 上 底 圆 的 圆周 上 。 不 失 一 般 性 ,计算 
机 中 ,强度 (了 的 值 域 为 [0,1], 色 度 ( 玉 ) 的 值 域 为 [0,360] 或 [0,1) ,饱和 度 (S) 的 值 域 则 为 
[0,1]。 

I 是 人 眼 所 能 感觉 到 的 表示 颜色 明暗 程度 的 物理 量 , 即 强度 量 。 在 数字 图 像 处 理 中 ,为 
了 便于 两 种 色彩 空间 之 间 的 变换 ,一 般 将 工 定义 为 RGB 三 个 分 量 的 平均 值 ( 有 的 变换 公式 
取 RGB 的 最 大 值 ) ,因此 工 确定 了 像素 的 整体 亮度 。 

RGB 与 HSI 模型 之 间 是 可 以 互相 转换 的 ,对 于 归 一 化 到 [0 一 1] 的 RGB 颜色 体系 ， 
由 了 RGB 到 HSI 的 转换 公式 为 


三 者 
5 


图 7-8 HSI 彩 色 空 间 坐 标 系 


(R 二 G 十 B) 
加 3 
及 十 G 十 也 
[CR 一 G) 十 CR 一 B)]/2 

| 
[(GR 一 G) 十 CR 一 B)]/2 
(R—G)’+(R—B)(G—B) 
由 HSI 到 RGB 的 转换 公式 分 为 3 种 情况 : 


SS 一 工 [minCR.,G,B)] 


(7-3) 


RG 或 R 关 B 


arceos| 
HH 


360° — arceos| | 有 关 在 


识 
~ 
贡 
RN 
中 

玉 
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(1) 若 互 在 0 一 120" 之 间 , 转 换 公 式 为 


攻 三 r+ Scos(H) 


cos(60°— H) 
G= 3I— (B+R) 
B=1(1—S) 
(2) 若 互 在 120" 一 240" 之 间 , 转 换 公 式 为 
R= 1(1—S) 


Scos(H— 120°) 
cos(180°— H) 


B= 3I—(R+G) 
(3) 若 互 在 240" 一 360" 之 间 , 转 换 公 式 为 

R= 3I— (G+B) 

G=1(1—5S) 


Scos(H — 240°) 
和 L 下 cos(300 一 万 ) 


(7-4) 


= (7-5) 


(7-6) 


2. HSV 颜色 模型 

HSV(hue， saturation,， value) 颜 色 模 型 是 A. R. Smith 根据 颜色 的 直观 特性 于 1978 年 
定义 的 一 种 颜色 空间 ,可 以 用 到 圆锥 体 表示 ,也 可 以 用 六 角 锥 体 模型 表示 (也 可 称 为 六 角 锥 
体 模型 )。 不 同 于 RGB 和 CMYK 面向 硬件 的 特性 , HSV 颜色 模型 是 面向 视觉 感知 的 。 
RGB 颜色 空间 中 ,三 种 颜色 分 量 的 取 值 与 所 生成 的 颜色 之 间 的 联系 并 不 直观 ,而 HSV 颜色 
空间 ,更 类 似 于 人 类 感觉 色彩 的 方式 。 

HSYV 模型 包括 色 度 (hue) 、 饱 和 度 (saturation) ,明度 (value 或 brightness) 三 个 参数 ,是 
一 种 将 RGB 色彩 空间 中 的 点 在 倒 圆 锥 体 中 的 表示 方法 。 

色 度 态 是 色彩 的 基本 属性 , 即 所 处 的 光谱 颜色 的 位 置 ,就 是 平常 所 指 的 颜色 ,如 红色 、 
黄色 等 , 末 取 值 范围 为 0"~~360”, 从 红色 开始 按 逆 时 针 方向 的 顺序 ,红色 为 0" ,绿色 为 120”， 
蓝 色 为 240 ,它们 的 补 色 分 别 是 黄色 为 60" ,青色 为 180", 品 红 为 300 。 

饱和 度 S 为 一 比例 值 , 也 可 以 称 为 纯度 ,表示 该 颜色 接近 光谱 色 的 程度 , 即 色彩 的 纯 
度 , 取 值 0 一 100%% 之 间 , 值 越 高 色彩 越 纯 , 值 低 则 逐渐 变 灰 。 饱 和 度 高 ,颜色 则 深 而 艳 。 

明度 V 表示 颜色 明亮 的 程度 ,通常 取 值 范围 为 0~~100%, 即 由 黑 至 白 。 它 和 光 强 度 之 
间 并 没有 直接 的 联系 ,对 于 光源 色 , 明 度 值 与 发 光 体 的 光亮 度 有 关 ; 对 于 物体 色 , 此 值 和 物 
体 的 透射 比 或 反射 比 有 关 。 

HSYV 颜色 空间 可 以 用 一 个 圆锥 空间 模型 来 描述 ,如 图 7-9 所 示 , 圆 锥 的 顶点 处 ,V 王 0， 
瓦 和 S 无 定义 ,代表 黑色 。 圆 锥 的 顶 面 中 心 处 V 王 max,S 一 0, 巨 无 定义 ,代表 白色 。HSV 
的 三 维 表示 可 以 认为 是 从 RGB 立方 体 演 化 而 来 ,设想 从 RGB 沿 立方 体 对 角 线 的 白色 顶点 
向 黑色 顶点 观察 ,就 可 以 看 到 立方 体 的 六 边 形 外 形 。 六 边 形 边界 表示 色彩 ,水 平 轴 表 示 纯 
度 , 明 度 沿 垂直 轴 测 量 。 

RGB 与 HSV 模型 之 间 也 可 以 互相 转换 。 

(1) 由 RGB 到 HSYV 的 转换 公式 为 

人 S 

max = max(R.G.B) 
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图 7-9 HSV 颜色 空间 模型 


min = min(R,G,B) 


0” max = min 
60°Xx— 8—b +o° max 一 ”8 过 0 
max 一 min 
o 区 一 雪 o 
的 "二 =r,g<=b 
h= a ~ 0 me (Ct 
60"X 一 2 一 ”十 120” max 一 8 
max 一 min 
60"X 一 -一生 -十 240” max=6 
max 一 min 
0” max 一 0 
s= se 和 (7-8) 
5 max 一 min_ | min 其 他 
max max 
v= max (7-9) 
(2) 由 HSV 到 RGB 的 转换 公式 为 
二 [A 
二 ,二 [5 (mod 6) (7-10) 
太一 五 一 Cpl 
60 
p= vl1—s) C7-12) 
9 一 (1 一 三 Xs) C7=13) 
t=vl—(l—/) Xs) (7-14) 
对 于 RGB 空间 的 每 一 个 颜色 向 量 (r,g ,6), 则 有 
(vstsp) hi=0 
(gsvsp) hi;=1 
(pwst) hi=2 
(r,g,b) = X75% 
(prgsv) hi=3 
(bo hi=4 
(v,pq) h;=5 


史 
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3. YUV 颜色 模型 

YUV 表示 电视 信号 的 彩色 坐标 系统 ,当时 推出 YUV 模型 主要 用 于 优化 彩色 视频 信号 
的 传输 ,使 其 向 后 相 容 黑白 电视 。YUYV 彩色 电视 信号 传输 时 ,将 R、G、B 变换 为 亮度 信号 
和 色 度 信和 号。 与 RGB 视频 信和 号 传输 相 比 ,YUV 的 主要 优点 是 占用 的 频 宽 较 少 。PAL 制式 
将 R.G.B 三 色 信 号 改组 成 Y.U、V 信号 ,其 中 YY 表示 明亮 度 (luminance 或 luma) ,也 就 是 
灰 度 值 ; 而 U 和 V 表示 的 则 是 色 度 (chrominance 或 chroma) ,作用 是 描述 视频 帧 图 像 的 色 
彩 及 饱和 度 , 用 于 定义 像素 的 颜色 。 亮 度 是 透 过 RGB 输入 信和 号 来 建立 的 , 色 度 则 定义 了 颜 
色 的 两 个 方面 一 一 色调 与 饱和 度 ,分 别 用 w 和 w 来 表示 。 

RGB 与 YUV 之 间 的 转换 关系 为 


0.299 0.587 0.1141|[R 
U 0.148 0.289 0. 437 ||G 7 
V 0.615 05515 =071604LB 


车 由 YUV 转换 到 RGB, 则 转换 关系 为 


R 1 0 1. 140 ¥ 
Gl=|1 —0.395 一 0.581 |IU CT~17} 
B 1 2.032 0 V 


4. Lab 颜色 模型 

Lab 颜色 模型 是 国际 照明 委员 会 CIE(commission internationale de 1'eclairage) 制 定 和 
推出 的 颜色 模型 ,CIE 制定 了 一 系列 色 度 学 标准 ,CIE Lab 颜色 体系 就 是 其 中 应 用 较为 广泛 
的 一 项 成 果 。 

Lab 模型 于 1976 年 公布 , 它 也 是 基于 人 有 眼 对 颜色 的 视觉 感觉 而 定义 的 。Lab 模型 可 以 
表达 正常 视力 的 人 能 够 看 到 的 所 有 颜色 。Lab 描述 了 颜色 的 显示 方式 ,而 不 是 设备 (如 显示 
器 .桌面 打印 机 或 数码 相机 ) 生 成 颜色 所 需 的 特定 色 料 的 数量 ,因此 ，Lab 也 属于 与 设备 无 


关 的 颜色 模型 。 
Lab 色彩 模型 如 图 7-10 所 示 , 由 亮度 工 和 色彩 参数 a 、b 5 


三 个 要 素 组 成 。L 表示 亮度 (luminosity) ,a 表示 从 洋红 色 至 
绿色 的 范围 ,b 表示 从 黄色 至 蓝 色 的 范围 。Lab 的 亮度 分 量 
(L) 取 值 范围 是 0 一 100,a、2 的 值 域 均 为 十 127 一 一 128。 当 机 
a 二 十 127 时 是 红色 , 若 a 渐渐 过 渡 到 一 128 时 ,就 变 成 了 绿 
色 ; 0 一 十 127 是 黄色 ,过 渡 到 一 128 时 是 蓝 色 。 
Lab 色彩 模型 除 不 依赖 于 设备 的 优点 外 ,还 具有 一 些 重 
要 的 特点 : 一 是 色 域 宽阔 , 它 不 仅 包含 了 RGB、CMYK 的 所 图 7-10 ”Lab 颜色 模型 
有 色 域 ,Lab 颜色 空间 比 计算 机 显示 器 ,甚至 比 人 类 视觉 的 色 
域 范围 还 要 大 ; 二 是 Lab 色彩 模型 改进 了 RGB 模型 色彩 分 布 不 均 的 缺点 ,但 处 理 速度 却 与 
RGB 模型 同样 快 。 
RGB 模型 转换 到 Lab 模型 的 方法 如 下 。 
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1) 由 RGB 转换 到 XYZ 


元 
R= gamma 55-6) 
G= gamma (54 可 (7-18) 
b 
B= gamma (50-0 ) 
E ts] zx> 0.0405 
gamma(Z) 一 -199 
F 
12, 92 其 他 


E34 R 
-mle (7-20) 
之 B 


0.4124 0.3576 0.1805 
M= 


其 中 


一 |0.2126 0.7152 0.0722 

0.0193 0.1192 0.9505 

上 述 转换 模型 中 ,使 用 了 X.Y、2Z 三 刺激 值 。 什 么 是 X.Y、2Z 三 刺激 值 呢 ? CIE 色 度 学 

认为 ,颜色 的 感觉 是 由 于 RG、B 三 种 原色 光 刺 激 的 综合 结果 。 在 RG、B 三 原色 系统 中 ， 

红 、 绿 、 蓝 的 刺激 量 分 别 以 RG、B 表示 之 。 由 于 从 实际 光谱 中 选 定 的 、 绿 、 蓝 三 原色 光 不 能 

调配 出 自然 界 存在 的 所 有 色彩 。 因 此 ,CIE 于 1931 年 从 理论 上 假设 了 并 不 存在 于 自然 界 的 

三 种 原色 , 即 理论 三 原色 ,以 XY.Z 表示 ,以 期 从 理论 上 来 调 ( 匹 ) 配 一 切 色彩 ,形成 了 XYZ 

测 色 系 统 。X 原色 相当 于 饱和 度 比 光谱 红色 还 要 高 的 红 紫 ,Y 原色 相当 于 饱和 度 比 520nm 

的 光谱 绿 还 要 高 的 绿 ,Z 原色 相当 于 饱和 度 比 477nm 的 光谱 蓝 还 要 高 的 蓝 。 这 三 种 理论 原 
色 的 刺激 量 以 X.Y.Z 表示 , 即 所 谓 X.Y、Z 三 刺激 值 。 

2) 由 XYZ 转换 到 LAB 


L* L* =16x/(> 16 


“=50o[/( 过 六 天 党 ]] (7-21) 
=m) 


2 :> (车 ) 
f0) = (7~22) 
EE (十 击 其 他 


上 述 表达 式 中 ,L* .a* .6b* 是 最 终 的 Lab 彩色 空间 三 个 通道 的 值 ,X、Y、2Z 一 般 取 值 为 
95.047、100、108. 883。 完 全 按照 转换 算法 运算 包含 大 量 的 浮 点 运算 ,其 运算 量 很 大 ,车 
PC 实现 一 半 没 问题 ,如 果 在 Android 系统 上 运行 ,即使 采用 C++ 进行 加 速 处 理 ,速度 问题 也 
需要 引起 足够 的 重视 。 
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在 数字 图 像 处 理 中 还 有 一 种 较 广 泛 应 用 的 图 像 处 理 技 术 , 即 伪 彩 色 增 强 图 像 。 在 20 世 
纪 80 年 代 , 由 于 彩色 传感器 和 彩色 图 像 处 理 硬 件 的 逐渐 成 熟 ,彩色 图 像 处 理 技术 得 到 了 广 
泛 的 应 用 。 常 用 的 彩色 增强 方法 有 真 彩色 增强 技术 、 假 彩色 增强 技术 和 伪 彩 色 增 强 技术 三 
种 。 真 彩色 处 理 中 ,被 处 理 的 图 像 一 般 通过 全 彩色 传感器 获取 ,如 彩色 摄像 机 或 彩色 扫描 仪 
等 ; 假 彩色 处 理 是 一 种 尽量 通 近 真实 色彩 的 人 工 彩色 处 理 技术 ; 伪 彩 色 是 指 分 配 彩色 给 某 
一 灰 度 范围 或 某 一 灰 度 值 , 以 增强 图 像 辨 识 能 力 。 之 所 以 进行 彩色 增强 技术 方面 的 研究 ,是 
因为 色彩 图 像 具 有 以 下 两 个 重要 特点 : 

(1) 人 的 视觉 系统 对 色彩 非常 敏感 ,人 类 视觉 可 以 分 辨 几 千 种 不 同 的 颜色 ,但 却 只 能 分 
辨 出 几 十 种 不 同 的 灰 度 级 。 即 使 是 经 过 专门 训练 的 人 员 ( 如 X 射线 医生 ) 也 只 能 分 辨 几 十 
种 灰 度 级 ,而 对 于 彩色 来 说 ,人 的 眼睛 可 分 辨 出 上 千 种 彩色 的 色调 和 强度 。 因 此 ,在 一 幅 黑 
图 像 中 检测 不 到 的 信息 ,经 伪 彩 色 增强 后 可 较 容易 地 被 检测 出 来 。 

(2) 在 自动 图 像 分 析 中 ,彩色 是 对 分 析 有 利 的 一 个 因素 ,彩色 图 像 通 常 可 使 从 某 些 场 景 

中 抽取 和 识别 目标 的 处 理 变 得 更 加 简化 。 

因此 , 若 能 将 一 幅 灰 度 图 像 变 成 彩色 图 像 , 就 可 以 在 一 定 程度 上 达到 图 像 增 强 的 视觉 效 
果 。 实 际 生 活 中 许多 人 并 未 对 假 彩 色 图 像 处 理 与 伪 彩 色 图 像 处 理 进行 严格 区 分 ,但 从 图 像 
处 理 的 角度 来 看 ,二 者 还 是 存在 差别 的 。 例 如 ,人 们 常常 把 没有 颜色 的 人 物 照 片 用 人 工 着 色 
的 方法 彩色 化 ,其 目的 主要 是 使 其 颜色 尽量 接近 于 真实 色彩 ,一 般 认为 这 种 技术 属于 假 彩 色 
技术 。 普 拉 特 所 提出 的 假 彩色 是 指 将 一 幅 由 三 基色 描述 的 彩色 原始 图 像 或 具有 同一 内 容 的 
一 套 多 光谱 图 像 , 以 线性 或 非 线性 方法 , 逐 像素 映射 到 由 三 激励 值 所 确定 的 色 度 空间 。 


7.3.1 伪 彩 色 处 理 简介 


伪 彩 色 技 术 在 早期 的 遥感 图 像 处 理 中 已 有 应 用 ,采用 的 方法 是 光学 方 这 种 方法 具 
有 几何 失真 小 的 优点 ,但 处 理 速度 非常 慢 。 itl i 
是 不 同 的 ,处 理 一 幅 照 片 需 要 较 复杂 的 洗 印 技术 ,因此 在 一 定 程度 上 限制 了 其 应 用 范围 

伪 彩 色 处 理 是 图 像 处 理 中 常用 的 一 种 方法 ,是 指 通 过 将 每 一 个 灰 度 级 匹配 到 彩色 空间 
上 的 一 点 ,将 单 色 图 像 映射 为 一 幅 彩色 图 像 的 一 种 变换 ,可 按 某 种 预先 确定 的 规则 生成 映射 
0 从 而 实现 给 每 个 灰 度 级 范围 赋予 一 种 颜色 的 彩色 图 像 。 因 此 , 伪 彩 色 处 理 本 质 上 是 

彩色 映射 过 程 。 一 般 是 将 灰 度 轴 匹 配 到 颜色 空间 中 的 一 条 连续 的 曲线 上 ,例如 按 某 种 

Pe S 色 赋值 的 效果 更 好 。 伪 彩色 处 理 可 以 是 
连续 彩色 ,也 可 以 是 由 几 种 颜色 构成 的 彩色 。 

例 7-1: 灰 度 图 像 生成 伪 彩 色 

如 图 7-11 所 示 是 一 幅 单 色 灰 度 图 像 , 通 过 伪 彩 色 图 像 增强 技术 生成 的 彩色 图 像 如 
图 7-12 所 示 ,该 图 是 通过 红色 饱和 度 编码 产生 的 伪 彩 色 图 像 。 

伪 彩 色 增 强人 为 地 实现 了 由 灰 度 图 像 到 彩色 图 像 的 变换 ,从 而 将 人 眼 难 以 区 分 的 灰 度 
差异 变换 为 较 容 易 区 分 的 色彩 差异 。 由 于 原始 图 像 并 没有 颜色 ,将 其 变 为 彩色 的 过 程 实际 
上 是 一 种 被 控制 的 着 色 过 程 ,所 以 称 为 伪 彩 色 增 强 。 常 用 的 伪 彩 色 增 强 方法 有 和 密度 分 割 、 伪 
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彩色 变换 和 频 


53:2 


密度 分 害 
灰 度 值 动态 范 
使 每 一 灰 度 值 
灰 度 图 像 
分 别 用 平行 于 


域 滤波 法 三 种 。 


图 7-11 灰 度 图 像 图 7-12 伪 彩 色 增强 图 像 


密度 分 割 


是 伪 彩 色 处 理 技 术 中 最 简单 而 常用 的 一 种 方法 。 其 基本 原理 是 将 单 色 图 像 的 
悦 分 割 为 多 个 灰 度 值 区 间 ,使 分 割 后 的 每 一 区 间 对 应 某 一 种 颜色 ,必要 时 可 以 
对 应 一 种 颜色 ,形成 伪 彩 色 图 像 。 

可 以 视 为 二 维 亮度 函数 ,用 函数 /(z,y) 表 示 一 幅 灰 度 图 像 ,如 图 7-13 所 示 ， 
图 像 xzOy 坐标 平面 的 L 、 工 :平面 去 切割 图 像 函 数 /(z,y) ,这样 函 数 f(x,y) 


标 


在 分 割 处 Li 、L: 被 分 为 了 三 个 灰 度 值 区 间 ,形成 三 个 部 分 。 
分 割 完成 以 后 ,如 果 再 对 每 一 个 区 间 赋 予 某 种 颜色 ,就 可 以 将 原来 的 灰 度 图 像 变 换 成 具有 


三 种 颜色 的 彩 


色 图 像 。 如 图 7-14 所 示 , 以 g(z,y) 表 示 变 换 后 的 彩色 图 像 , 即 目标 图 像 ,为 表 


示 方 便 , 图 像 fCz,y) 切 割 处 的 像素 值 用 切割 平面 符号 表示 。 如 果 用 NN 个 平面 LL;、…、Ln 去 


切割 图 像 函 数 


对 于 每 一 像素 ; 


f(x,y) 


f(z,y), 则 可 以 得 到 N 十 1 个 灰 度 值 区 间 , 每 一 个 区 间 对 应 一 种 颜色 Cv。 于 是 ， 
点 (zyy) 就 可 以 按 图 7-14 所 示 方 式 形成 颜色 匹配 关系 。 


目标 图 像 | se 必 
(ey 


Lh Ly % 


图 7-13 密度 分 割 示意 图 图 7-14 多 灰 度 伪 彩色 切割 图 颜色 匹配 梯 关 系 


如 果 将 每 
以 形成 索引 图 


一 个 灰 度 值 都 划分 成 一 个 区 间 , 如 将 8bit 灰 度 图 像 划分 成 256 个 区 间 , 则 可 
像 , 因 此 ,可 以 认为 索引 图 像 是 由 灰 度 图 像 经 最 大 密度 分 割 而 生成 的 图 像 。 需 
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要 注意 的 是 ,每 一 灰 度 值 区 间 赋 予 何 种 颜色 ,是 由 具体 应 用 所 决定 的 ,并 无 规律 可 言 。 但 总 
的 来 讲 , 相 邻 灰 度 值 区 间 的 颜色 差别 不 宜 太 小 也 不 宜 太 大 , 太 小 将 无 法 反映 细节 上 的 差异 ， 
太 大 则 会 导致 图 像 出 现 不 连续 性 。 实 际 应 用 中 ,密度 切割 平面 之 间 可 以 是 等 间隔 的 ,也 可 以 
是 不 等 间隔 的 ,而 且 切 割 平 面 的 划分 也 应 依据 具体 的 应 用 范围 和 研究 对 象 而 确定 。 

基于 密度 分 割 的 伪 彩 色 处 理 的 特点 是 简单 易 行 ,便于 用 软件 或 硬件 实现 ,可 以 实现 实时 
处 理 , 而 且 具 有 广泛 的 用 途 和 很 高 的 精度 。 


7.3.3 灰 度 级 伪 彩 色 变换 


密度 分 割 法 实质 上 是 通过 一 个 分 段 线性 函数 实现 从 灰 度 到 彩色 的 变换 ,每 个 像素 点 只 
经 过 一 个 变换 对 应 到 某 一 种 颜色 。 灰 度 级 伪 彩 色 变 换 与 密度 分 割 有 所 不 同 ,其 基本 原理 是 ， 
将 输入 图 像 的 每 一 像素 点 的 灰 度 值 进 行 三 个 互相 独立 的 变换 ,分 别 产生 红 、 绿 、 蓝 三 个 分 量 
图 像 , 然 后 将 其 合成 为 一 幅 彩 色 图 像 。 

伪 彩 色 变换 过 程 如 图 7-15 所 示 , 将 灰 度 图 像 送 入 具有 不 同 变换 特性 的 红 、 绿 、 蓝 3 个 
变换 器 ,再 将 3 个 变换 器 的 不 同 输出 分 别 送 到 彩色 显像管 的 红 、 绿 、 蓝 电子 枪 。 同 一 灰 度 
由 3 个 变换 器 对 其 实施 不 同 变换 ,根据 3 个 变换 器 的 不 同 输出 ,在 彩色 显像管 内 合成 某 种 
彩色 。 可 见 ,不 同 的 灰 度 级 一 定 可 以 合成 不 同色 彩 。 灰 度 级 伪 彩 色 变换 可 以 将 灰 度 图 像 
变 为 具有 多 种 颜色 渐变 的 连续 彩色 图 像 , 这 种 伪 彩 色 处 理 技术 在 遥感 技术 中 常 称 为 假 彩 
色 合 成 方法 。 


红 转 换 Ceg | 


TAx, ») 
Fe) 绿 转换 (green) 14 了 | RGB 显像管 


lax,») 
蓝 转换 (blue) | 一 | 


图 7-15 伪 彩 色 变换 原理 


变换 公式 的 形式 为 
R(x,y) = Tx[f(zx,y)] 
GCCzyy) = Toe[ f(z,y)] (7=23) 
B(Czyy) = Ts[Lfl(z;y)] 
式 中 ,/(z,y) 表 示 原 始 图 像 灰 度 值 函数 ; RC(z,y)、G(z,y)、B(z,y) 分 别 是 伪 彩 色 中 
红 \ 绿 、 蓝 三 基色 分 量 的 数值 ; T,[]、Te[]、Ts[] 分 别 表示 与 原始 图 像 灰 度 值 的 函数 关系 。 
三 个 变换 函数 要 求 相互 独立 ,但 在 实际 应 用 中 变换 函数 可 以 取 带 绝对 值 的 正弦 函数 、 线 
性 变换 函数 等 同一 类 型 的 函数 。 图 7-16 给 出 了 一 组 经 典 的 连续 变换 函数 , 灰 度 值 范围 为 
[0 ,站 ,每 个 变换 取 不 同 的 分 段 线性 函数 。 可 以 看 出 ,最 小 的 灰 度 值 0 映射 为 蓝 色 , 中 间 的 
灰 度 值 L/2 映射 为 绿色 ,最 高 的 灰 度 值 工 映射 为 红色 ,其 余 的 灰 度 值 根据 该 曲线 分 别 映射 
为 相应 的 颜色 。 
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图 7-16 伪 彩 色 变换 函数 


7.4 全 彩色 图 像 处 理 


自然 界 的 颜色 是 多 种 多 样 . 丰 富 多 彩 的 ,能 真实 反映 自然 物体 真实 色彩 的 图 像 叫 真 彩色 
图 像 或 全 彩色 图 像 , 若 彩色 图 像 的 单 通道 位 深度 为 8 位 , 则 真 彩色 图 像 是 指 24 位 RGB 图 
像 。RGB 图 像 一 般 由 彩色 照相 机 、 彩 色 摄像 机 或 其 他 彩色 数字 化 设备 获取 。 


7.4.1 彩色 图 像 处 理 方 法 分 类 


RGB 真 彩色 图 像 的 处 理 一 般 可 以 分 为 合成 处 理 法 和 直接 处 理 法 两 大 类 。 

(1) 合成 处 理 法 ,即将 RGB 图 像 分 解 为 RG、B 三 个 波段 的 图 像 分 量 ,分 别 对 尺 分 量 、 
G 分 量 .B 分 量 的 图 像 进行 处 理 , 处 理 之 后 合成 处 理 后 的 彩色 图 像 。 

(2) 直接 处 理 法 , 指 直接 处 理 每 一 个 彩色 像素 , 即 每 一 个 像素 是 一 个 三 维 分 量 , 令 c 表 
示 RGB 图 像 任意 像素 的 向 量 , 则 有 


CR R 
c= le = | (7-24) 
Ce B 
一 幅 大 小 MXN 的 图 像 , 则 有 MAN 个 24 分 量 的 彩色 向 量 c(z,y), 即 
Cr (zx,y) R(x,y) 
cCzyy) 一 jsco|- je] C7-25) 
Cg(zx,y) BCz,y) 


工 二 1,2,3,…,M 一 1; y 一 1;,2,3,…:N 一 1 
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这 两 种 方法 都 应 


个 通道 进行 合成 。 


了 多 幅 灰 度 图 像 的 合成 处 理 技术 ,在 计算 机 中 ,任何 一 种 颜色 都 可 以 
红 、 绿 、 蓝 三 基色 通过 合成 得 到 ,因此 这 两 种 技术 一 般 是 将 三 幅 图 像 分 别 作 为 红 、 绿 、 蓝 三 


7.4.2 ”彩色 图 像 直方 图 增强 


从 前 述 章 节 中 可 以 看 到 ,直方 图 处 理 对 于 灰 度 图 像 具 有 较 好 增强 效果 ,同样 ,直方 图 处 
理 对 于 彩色 图 像 也 具有 很 好 的 效果 。 彩 色 图 像 直 方 图 均衡 化 的 作用 是 扩展 输入 图 像 各 分 量 
灰 度 值 的 动态 范围 ,提高 图 像 的 对 比 度 和 亮度 。 

例 7-2: 彩色 图 像 直方 图 增强 实验 


用 的 lena. jpg 图 像 , 原 


图 像 的 尺 


示 。 将 原始 图 像 的 尽 .G、B 分 量 
后 再 由 处 理 后 的 三 个 分 量 和 矩阵 合成 RGB 图 像 。 


(c) G 分 量 图 


图 


像 直方 图 增强 处 理 效果 。 图 7-17(a) 为 原始 图 像 , 这 是 一 幅 广泛 使 


分 量 .G 分 量 .B 分 量 的 图 像 分 别 如 图 7-17(b)、(Cc)、(d) 所 
图 像 分 别 进行 直方 图 均衡 化 处 理 , 以 增强 图 像 的 对 比 度 , 然 


(b) R 分 量 图 像 


像 (d) 8 分 量 图 像 


7-17 RGB 原始 图 像 及 各 分 量 图 像 


这 里 选择 lena 图 像 作为 彩 
具有 相对 复杂 的 细节 和 纹理 ,同时 也 有 大 片 的 平滑 区 域 .适度 地 混合 了 细节 ,平滑 区 域 . 阴 影 
和 纹理 多 方面 的 综合 信息 ,从 而 能 很 好 地 测试 各 种 图 像 处 理 算法 。 彩 色 图 像 lena 均衡 化 以 
后 的 结果 图 像 如 图 7-18 所 示 。 本 实验 结果 表明 ,直方 图 均衡 化 对 彩色 图 像 的 显示 效果 也 有 


色 图 像 处 理 测试 图 像 ,不 是 因为 lena 漂亮 ,而 是 因为 该 图 像 
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显著 的 增强 作用 。 对 比 度 增强 源 于 直方 图 在 整个 亮度 标 度 上 的 显著 扩展 ,亮度 的 增强 是 因 
为 均衡 化 后 的 图 像 的 直方 图 中 灰 度 级 平均 值 高 于 原始 值 。 


7.4.3 彩色 图 像 去 噪 


彩色 图 像 去 噪 基础 理论 和 灰 度 图 像 去 噪 方法 类 似 , 不 同 之 处 是 需 按 RGB 三 分 量 分 
别 进行 滤波 消 噪 ,在 彩色 图 像 消 噪 中 ,前 述 章 节 介绍 过 的 空域 滤波 和 频 域 滤波 方法 都 可 以 根 
据 情况 选择 采用 。 例 7-3 是 彩色 图 像 中 值 滤波 消除 噪声 实验 。 

例 7-3: 彩色 图 像 噪声 处 理 实验 

本 例 介绍 了 通过 中 值 滤波 消除 噪声 的 方法 和 步骤 ,选择 以 图 7-17(a) 所 示 lena. jpg 照片 
作为 原始 图 像 ,给 该 图 像 添加 方差 为 0. 05 的 高 斯 噪声 ,添加 噪声 后 的 lena 图 像 如 图 7-19 
所 示 。 


图 7-18 RGB 均衡 化 以 后 的 图 像 图 7-19 带 噪声 的 lena 图 像 


在 大 的 步骤 上 ,彩色 图 像 消 噪 方法 的 步骤 和 直方 图 
增强 方法 的 步骤 基本 类 似 ,首先 将 源 图 像 的 RG、B 分 
量 数据 分 别 读 出 ,再 对 三 个 分 量 灰 度 和 矩阵 分 别 进行 滤 
波 , 结 合 噪声 和 图 像 的 特点 ,采用 中 值 滤 波 消除 噪声 , 完 
成 滤波 之 后 按 R.G、B 合成 新 的 彩色 图 像 ,滤波 结果 如 
图 7-20 所 示 。 从 中 可 以 看 出 ,噪声 得 到 了 明显 的 抑制 ， 
消 噪 效果 非常 明显 。 

MATLAB 代码 如 下 : 


cle; 

clear all; 

Image a= imread( 'C:\Users\chen\Desktop\color_lenal. 
jpg'); 


j= imnoise( Image a, 'gaussian', 0.05); 


图 7-20 消除 噪声 后 的 lena 图 像 


figure(1); 

imshow( Image_a); 
figure(2); 

subplot (1,2,1); imshow(j); 
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b=j(:,:, 
c=i( 
d=j(:,:,3); 


bl = medfilt2(b); 

cl= medfilt2(c); 

dl = medfilt2(d); 

Image al(:,:,1)= bl; 

Image al(:,:,2)=cl1; 

Image al(:,:,3)= dl; 
subplot(1,2,2);imshow(Image_al); 


7.4.4 ”彩色 频 域 处 理 


与 灰 度 图 像 一 样 ,彩色 图 像 处 理 也 可 以 在 频 域 进行 。 彩 色 图 像 频 域 滤波 的 基本 原理 是 ， 
先 将 RGB 彩色 图 像 的 RG、B 三 个 分 量 分 别 进行 傅 里 叶 变 换 , 并 根据 各 分 量 的 特点 和 图 像 
处 理 的 目的 ,对 各 分 量 分 别 选 择 进行 低 通 ,高 通 、 带 通 或 带 阻 滤波 ,以 及 对 各 分 量 信息 进行 其 
他 处 理 。 例 如 ,为 了 突出 高 频 信息 将 其 转换 为 红色 ,只 需 在 红色 通道 滤波 器 设计 为 具有 高 通 
特性 即 可 ,然后 再 对 各 分 量 进行 IFFT 变换 ,最 后 合成 彩色 图 像 , 完 成 全 彩色 处 理 。 频 域 滤 
波 的 过 程 如 图 7-21 所 示 。 


一 -一 
R 分 最 “上 | 二 | FFT 变换 | 二] R 分 量 频 域 滤波 | 二 | IFFT 变 换 


RGB 彩色 图 像 | G 分 量 | FFT 变 换 [| G 分 量 频 域 滤波 | 二 | IFFT 变 换 合成 RGB 图 像 


8 分 量 “上 二 FFT 变 换 上 -一 | 3 分 量 频 域 滤波 | 一 | IFFT 变 换 


图 7-21 彩色 图 像 频 域 处 理 过 程 


习题 


1. 什么 是 索引 图 像 和 RGB 彩色 图 像 ? 两 者 有 何 区 别 和 联系 ? 

2. 简 述 人 眼 视觉 模型 的 基本 原理 。 

3. 在 电磁 波谱 中 ,可 见 光 的 波长 范围 是 多 少 ? 

4. 常用 的 计算 机 的 颜色 模型 有 哪 几 种 类 型 ? 各 有 何 特 点 ? 

5. 面向 硬件 设备 的 颜色 模型 主要 有 哪 几 种 ? 

6. 面向 视觉 感知 的 颜色 模型 主要 有 哪 几 种 ? 

7. RGB 与 HSI 颜色 模型 各 有 何 特点 ? 如 何 实现 数字 图 像 的 RGB 到 HSI 模型 的 


8. 编写 程序 观察 一 幅 彩 色 图 像 的 RG、B 分 量 图 像 。 
9. 编写 程序 观察 一 幅 彩 色 图 像 的 互 .SI 分 量 图 像 。 
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10. 编写 MATLAB 程序 实现 由 RGB 到 HSV 颜色 体系 的 转换 。 

11. 编写 程序 观察 一 幅 彩色 图 像 的 互 .S、V 分 量 图 像 。 

12. 编写 MATLAB 程序 实现 由 RGB 到 YUV 颜色 体系 的 转换 。 

13. 简要 阐述 如 何 实 现 伪 彩 色 图 像 增强 。 

14. 简 述 彩色 图 像 增强 的 基本 原理 和 步骤 。 

15. 选择 一 幅 彩 色 图 像 ,编写 MATLAB 程序 实现 图 像 的 直方 图 均衡 化 。 


2 图 像 复 原 


CHAPTER 8 


图 像 复 原 又 称 为 图 像 恢复 ,最 初 主要 是 针对 图 像 在 成 像 过 程 中 的 “退化 "而 提出 来 的 ,而 
成 像 过 程 中 的 “退化 ?现象 主要 指 成 像 系 统 受 到 各 种 因素 的 影响 ,如 成 像 系 统 的 散 焦 ` 设 备 与 
物体 间 存 在 相对 运动 或 器 材 的 固有 缺陷 等 ,导致 图 像 的 质量 不 能 够 达到 理想 要 求 。 因 此 , 需 
要 研究 图 像 复 原 技 术 以 便 对 图 像 进行 恢复 。 图 像 复 原 与 图 像 增强 技术 一 样 , 也 是 一 种 改善 
图 像 质 量 的 技术 方法 。 图 像 复 原 的 基本 方法 是 根据 事先 建立 起 来 的 成 像 系 统 退 化 模型 ,将 
退化 了 的 图 像 以 最 大 的 保 真 度 恢复 为 原始 图 像 或 物体 的 真实 影像 。 本 章 围 绕 图 像 退化 的 原 
因 , 首 先 讨论 图 像 退 化 数学 模型 的 概念 ,然后 讨论 图 像 的 无 约束 复原 及 逆 滤 波 复原 有 约束 
复原 .匀速 运动 模糊 恢复 等 方法 的 基本 原理 ,最 后 介绍 几何 畸变 复原 .盲目 图 像 复 原 及 中 值 
滤波 复原 方法 等 。 


8.1 图 像 退 化 机 理 


在 数字 图 像 的 获取 过 程 中 ,由 于 各 种 各 样 的 原因 ,图 像 会 产生 一 定 程度 的 退化 。 图 像 获 
取 过 程 中 因 光 学 成 像 系 统 的 像 差 .光学 成 像 衍 射 \ 成 像 系 统 的 非 线 性 畸变 、 摄 影 胶片 感光 特 
性 的 非 线性 ,以 及 成 像 过 程 的 相对 运动 ,传输 介质 ,大气 消 流 和 环境 因素 等 原因 ,都 会 不 同 程 
度 地 造成 图 像 质量 的 下 降 或 退化 。 


8.1.1 退化 原因 


造成 图 像 退化 的 原因 很 多 ,一 般 认 为 以 下 几 种 情况 可 导致 图 像 质量 的 退化 : 

(1) 成 像 系 统 镜头 聚焦 不 准 产生 的 散 焦 。 

(2) 相机 与 景物 之 间 的 相对 运动 。 

(3) 成 像 系 统 存在 的 各 种 非 线性 因素 以 及 系统 本 身 的 性 能 等 因素 使 图 像 质量 下 降 。 

(4) 遥感 遥测 中 ,由 于 飞机 、 轨 道 卫星 的 运动 稳定 性 ,以 及 地 球 自转 等 因素 引起 的 和 遥感 
图 像 几何 失真 。 

(5) 模拟 图 像 在 数字 化 过 程 中 ,因数 字 化 的 精度 和 误差 而 不 同 程度 地 损失 一 些 图 像 
细节 。 

(6) 射线 辐射 .大气 湛 流 等 因素 造成 的 照片 畸变 。 

(7) 成 像 系 统 的 像 差 畸变 有限 带宽 等 非 理想 因素 造成 的 图 像 失真 。 
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(8) 底片 感光 .图像 显 示 时 会 造成 记录 显示 失真 。 
(9) 成 像 系 统 中 存在 的 各 种 随机 噪声 。 


8.1.2 复原 机 理 


图 像 复 原 的 过 程 一 般 是 沿 着 图 像 退 化 的 逆向 过 程 进行 的 ,因此 ,首先 根据 先 验 知识 分 析 
退化 原因 ,了 解 图 像 变质 的 机 理 , 在 此 基础 上 建立 图 像 的 退化 模型 ,然后 以 相反 的 过 程 ( 退 化 
的 逆 过 程 ) 对 图 像 进行 处 理 , 使 图 像 质量 得 到 补偿 和 改善 。 通 常情 况 下 ,图 像 复 原 的 质量 是 
根据 一 些 规定 的 客观 准则 来 评价 的 ,如 最 小 均 方 准则 、 加 权 均 方 准 则 等 ,也 可 以 采用 定性 标 
准 , 即 图 像 接近 全 真 景物 图 像 的 程度 是 否 到 达 最 佳 。 

虽然 图 像 复 原 与 图 像 增 强 从 表面 上 看 都 是 为 了 提高 图 像 的 质量 ,但 它们 之 间 无 论 是 过 
程 还 是 目的 都 存在 明显 的 区 别 。 

图 像 增强 技术 是 采用 特定 技术 来 突出 和 强调 图 像 中 所 关注 的 特征 ,在 对 图 像 进行 增强 
处 理 的 过 程 中 ,一 般 不 考虑 图 像 退 化 的 真实 物理 过 程 ,只 关注 图 像 增强 后 的 实际 效果 ,根据 
目的 和 用 途 的 不 同 , 既 可 以 增强 一 幅 图 像 的 全 部 ,也 可 以 仅 增强 图 像 的 某 一 部 分 ; 与 原始 图 
像 相 比 ,增强 后 的 图 像 还 可 能 损失 掉 部 分 信息 。 因 此 ,图 像 增强 的 目的 是 提高 视 感 质量 ,但 
增强 后 的 图 像 可 能 与 原始 图 像 有 一 定 的 差异 。 

图 像 复 原 是 直接 针对 图 像 产生 退化 的 原因 ,建立 相应 的 数学 模型 ,采取 沿 着 图 像 降 质 的 
逆 过 程 等 技术 手段 对 退化 图 像 进 行 有 针对 性 的 补偿 ,使 恢复 后 的 图 像 最 大 限度 地 接近 原始 
图 像 。 因 此 ,图 像 复 原 不 是 为 了 突出 或 增强 图 像 的 某 些 信息 ,而 是 为 了 减少 或 消除 各 种 因素 
所 造成 的 图 像 质 量 下 降 ,恢复 图 像 的 本 来 面目 。 也 就 是 说 ,使 待 复原 的 图 像 与 原始 图 像 尽 可 
能 一 致 。 图 像 复 原 的 主要 任务 是 建立 图 像 复原 的 反 向 过 程 的 数学 模型 。 

由 于 导致 图 像 退 化 的 原因 众多 ,性 质 各 不 相同 ,相应 地 描述 图 像 退 化 过 程 的 数学 模型 也 
多 种 多 样 ,而 恢复 的 质量 标准 也 往往 存在 差异 性 。 因 此 ,图 像 复 原 是 一 个 复杂 的 数学 过 程 ， 
退化 原因 不 同 , 图 像 复 原 的 方法 .技术 也 各 不 相同 。 


8.2 图 像 退 化 模型 


图 像 复原 技术 的 主要 任务 是 建立 系统 的 退化 模型 。 设 /(z,y) 为 输入 图 像 ,/(x,y) 经 
过 某 个 退化 系统 后 输出 的 是 一 幅 退 化 的 图 像 ,退化 系统 以 H(z,y) 表 示 , 退 化 过 程 中 ,噪声 
引起 的 退化 一 般 可 视 为 加 性 噪声 ,虽然 从 噪声 的 种 类 而 言 还 包括 乘 性 噪声 ,但 从 图 像 系 
统 的 应 用 情况 看 ,无论 量化 噪声 ,还 是 随机 噪声 等 都 普遍 表现 为 加 性 噪声 ,噪声 用 n(x,y) 
表示 。 

因此 ,在 考虑 噪声 的 影响 以 后 ,图 像 /(zx,y) 的 退 
化 过 程 表 现 为 ,F(z,y) 经 过 一 个 退化 系统 甩 (z,y) 的 
作用 ,并 与 噪声 wx(z,y) 倒 加 ,形成 退化 后 的 图 像 g(z， 
y)。 这 一 过 程 的 输入 和 输出 关系 如 图 8-1 所 示 。 

该 退化 模型 中 ,有 H(z,y) 概 括 了 图 像 退化 系统 的 物 。 “图 81 图 像 退 化 系统 的 数学 模型 
理 过 程 ,是 研究 退化 所 欲 探 求 的 数学 模型 。 图 像 复 原 
问题 就 是 根据 已 有 的 退化 图 像 (x,y) ,通过 寻求 合理 的 退化 系统 厅 (zx,y) ,以 退化 的 逆 过 
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Je) g(x,») 
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程 去 获取 原始 图 像 /(zx,y) ,或 者 说 是 逆向 地 寻找 原始 图 像 的 最 佳 估计 。 
根据 上 述 分 析 和 图 8-1 所 示 模 型 ,如 果 系统 没有 噪声 或 者 不 考虑 噪声 的 影响 ,图像 退 化 
的 过 程 可 以 用 数学 表达 式 写 为 


g(x,y) = H. f(r,y) (8-1) 
g(rzy) = H。. f(xy)+n(r,y) (8-2) 


式 中 , 太 表 示 甩 (zx,y), 即 将 图 像 的 退化 过 程 抽象 为 一 个 系统 (或 称 算 子 ) 矿 的 作用 ; 噪 
声 zCzyy) 是 一 种 统计 性 质 的 信息 ,一般 可 用 白 噪 声 模型 表示 , 白 噪 声 的 一 般 特性 是 频谱 密 
度 为 常数 ,并 与 图 像 不 相关 。 

虽然 从 严格 意义 上 讲 ,一 切 图 像 系统 都 表现 出 非 线 性 、 时 变 等 特性 ,但 实际 应 用 中 ,根据 
人 类 视觉 的 灵敏 性 以 及 实际 图 像 系统 的 近似 特性 ,实际 图 像 系统 都 可 以 用 线性 、 时 不 变 和 空 
间 不 变 的 系统 模型 近似 表示 。 这 一 点 不 仅 给 图 像 处 理 和 图 像 复原 工作 带 来 了 方便 ,也 比 非 
线性 系统 更 具有 实际 意义 和 可 用 人 性。 


8.2.1 退化 模型 的 一 般 特性 


由 于 实际 图 像 系统 及 其 退化 系统 都 表现 为 线性 、 时 不 变 和 位 置 不 变 特性 ,因此 ,退化 系 
统 甩 具有 以 下 两 个 主要 性 质 。 
1. 线性 特性 
车 kz 为 常数 , 当 不 考虑 噪声 作用 , 即 n(z,y) 二 0 时 , 则 
H[k fi (xsy) tk f(r,y) = HLk (zyy)] 十 五 LA fi (zx,y)] 

= kgi(r,y) + kegs (x,y) 

(1) 二 ks 二 1 时 ,表现 为 可 加 性 , 即 

五 LA zyy) 十 PCzy)]= HLfi (zx,y)]+ HLf, (zx,y)] 

一 Si(Czyy) 十 gz(Czyy) 

(2) ,ks 任 一 个 常数 为 0 时 (如 ,二 0) ,表现 为 比例 性 , 即 

五 [已 广 (z,y) = kigi(r,y) 


2. 空间 位 置 不 变性 
对 任 一 图 像 /(z,y) 和 常数 a、B, 若 

g(Czyy) = H. f(x,y) 
则 


H. f(r—a,y—BP) 一 SC 一 ay 一 有 ) 
空间 位 置 不 变性 的 实际 意义 是 ,对 图 像 f(z,y) 上 任 一 点 的 处 理 结果 ,只 取决 
输入 值 ,而 与 该 点 的 坐标 位 置 无 关 。 


8.2.2 连续 退化 模型 


下 面 介 绍 连续 图 像 退化 的 数学 模型 。 
设 /(z,y) 表 示 连 续 图 像 ,根据 6 冲 激 函数 的 筛选 性 质 , 则 连续 图 像 fCz,y) 可 以 表示 为 
6 函数 与 (zx,y) 的 卷 积 积分 , 即 


nn 
放 
东 
到 


像 复原 | 193 


194 大 | 数字 图 像 处 理 及 应 用 一 一 使 用 MATLAB 分 析 与 实现 


二 [| epee may — PdadB 
6 函数 的 物理 意义 表示 空间 上 的 点 脉冲 。 
一 般 情况 下 ,不 考虑 噪声 的 影响 ( 设 退 化 模型 中 的 n(x,y) 二 0), 根 据 6 函数 的 性 质 , 连 
续 图 像 经 过 退化 系统 五 后 的 输出 为 


Bl = R= | | arreepace 一 wy 一 PD]dadp 
由 于 f(a,B) 与 x、y 无 关 , 根 据 线性 齐 次 性 可 得 
二 ,三 Ei fla HB —asy— dzdp 


-| | respyncz 一 wy 一 pdadp (8-3) 


式 中 ,h(x 一 a,y 一 B) 可 以 表示 为 h(z,a,y,B) , 称 为 系统 的 冲 激 响应 函数 , 它 表 示 系 统 人 
对 坐标 为 (a,B) 处 的 冲 激 函 数 6(zr 一 a,y 一 B) 的 响应。 在 光学 中 , 冲 激 为 一 个 光 点 ,因此 ， 
h(xz,a,y,B) 一 般 也 被 称 为 点 扩散 函数 。 
根据 式 (8-3) 可 知 ,车 系统 的 冲 激 响应 函数 已 知 ,就 可 以 知道 退化 系统 是 如 何 形成 的 ， 
即 对 任 一 输入 f(a,B) ,其 响应 都 可 以 通过 式 (8-3) 进 行 卷 积 计 算 , 即 
8g(Cryy) = fxsy) hh(r,y) (8-4) 
由 于 图 像 的 退化 过 程 可 以 认为 是 线性 空间 的 不 变 系统 ,因此 系统 输出 的 退化 图 像 g(x,y) 
应 为 输入 图 像 和 系统 冲 激 响 应 的 卷 积 积分 。 
对 式 (8-4) 两 边 进行 傅 里 叶 变换 ,可 得 
Glusv) = H(u,v)F (u,v) (8-5) 
式 中 ,G(usv)、F(u,v) 分 别 是 g(z,y)、f(z,y) 的 二 维 傅 里 叶 变 换 ; 函数 末 (u,v) 称 为 
退化 系统 的 传递 函数 , 它 是 退化 系统 冲 激 响应 h(x,y) 的 傅 里 叶 变 换 。 
若 考虑 加 性 噪声 n(z,y) 的 影响 , 则 连续 函数 的 退化 模型 可 表示 为 


SCzyy) = [ flasBh(r—a,y— BdadBi+ n(xr,y) (8-6) 
即 
g(Czyy) = f(x,y) hr y) tn(r,y) (8-7) 
同样 ,对 上 式 两 边 进行 傅 里 叶 变换 ,可 得 
Glu,v) = Husv Fu,v) t+ N(u,v) (8-8) 


式 中 ,N(u,v) 为 噪声 函数 n(x,y) 的 傅 里 叶 变 换 。 

由 于 采用 了 线性 模型 ,大 多 数 情 况 下 ,图 像 复 原 的 关键 任务 是 求解 冲 激 响应 函数 h(x,y)。 
一 般 而 言 ,系统 的 传递 函数 及 (u,v) 比 较 容易 获得 .而 五 (wx,u) 是 (zyy) 的 傅 里 叶 变 换 , 因 
此 ,图 像 复 原 所 研究 的 重点 是 线性 退化 模型 。 


8.2.3 离散 退化 模型 


数字 图 像 讨论 的 是 离散 的 图 像 函数 ,因此 需要 对 连续 模型 进行 离散 化 处 理 , 即 将 连续 模 
型 中 的 积分 以 求 和 的 形式 表示 。 

1. 一 维 离散 退化 模型 

不 考虑 噪声 的 情况 下 , 设 /(z) 被 均匀 采样 后 形成 具有 A 个 采样 值 的 离散 输入 函数 ， 
h(z) 被 采样 后 形成 具有 B 个 采样 值 的 退化 系统 冲 激 响应 。 因 此 ,连续 函数 退化 模型 中 的 连 
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如 果 f(z) 和 h(xz) 都 是 具有 周期 为 N 的 序列 ,那么 离散 的 退化 模型 可 表示 为 
g(7T)= f(r) *h(r) 
= Pfr—m) (8-9) 


显然 ,g(z) 也 是 具有 周期 N 的 序列 ,周期 卷 积 可 用 常规 卷 积 法 计算 。 

如 果 f(z) 和 有 h(z) 均 不 具有 周期 性 , 则 采用 在 末端 补 零 的 方法 延伸 ,使 其 扩展 为 周期 函 
数 f.(z) 和 h(xz), 令 周期 M 二 A 十 B 一 1, 则 f.(xz) 和 有 h(x) 可 分 别 表示 为 
0 0<zA—1 


£m=| 
0 A—1<zx<M-1 


h(xz) =] 
nw =| 
0 B=Ll<xeMW—i 


这 样 ,可 得 到 如 下 离散 卷 积 退化 模型 : 
glT) = Df mh (zr—m) (8-10) 


式 中 ,zx 二 0,1,2,…,M 一 1。 显然 ,g.(z) 也 是 周期 为 M 的 函数 。 
式 (8-10) 也 可 以 用 如 下 和 矩阵 形式 表示 : 


ge.(0) h.(0) he(—1) … (一 MI) f.(0) 
ge(1) h.(1) he(0) … hl—M+2) Re 
i |=| Woy hl) … he M+3) .lo (8-11) 
g.(M—1) heM—1) h.(—2) … h.(0) f.M—1) 
上 式 可 以 写 为 矩阵 方程 式 , 即 
g=H:/ (8-12) 
式 中 
f= 0 FD i 
g= [&(0) gl) gl2) oe gM— 111" 
h.(0) he(—1) … he(—M+1) 
[Ra] hl0) 2 he(— M+2) 
= | 让 (0 臣 hl) … he(— M+3) 
heM—1) hl—2) … h.(0) 


8g、 了 分别 是 MX1 列 向 量 ,H 为 MXM 循环 矩阵 。 由 于 h(x) 的 周期 为 M, 因 此 下 列表 
达 式 成 立 。 
h.(—1) = h.(M—1) 
h.(—2) = h.(M—2) 


h.(— M+2) = h.(2) 
h.(— M+1) =h.(1) 
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于 是 ,H 矩阵 可 以 简化 为 
h0) (一 D) hl) 
h.(1) he(0) 2 hl(2) 
H=| 无 (2) hl)  … 六 (3) 


heM—1) he(—2) … h.(0) 
2. 二 维 离散 退化 模型 
设 二 维 数字 图 像 用 /(z,y) 表 示 , 因 此 ,二 维 输入 图 像 /(z,y) 和 冲 激 响应 (zxz,y) 分 别 
具有 AXB 和 CXD 个 元 素 ,为 避免 交 倒 误差 ,与 一 维 离散 模型 类 似 , 采 用 末端 补 零 的 方法 
延 拓 ,将 它们 扩展 成 MX N 个 元 素 的 周期 扩展 图 像 ,其 中 M==A 十 C 一 1, N=B 十 D 一 1, 即 


f(xy) 0 委 工 委 A 一 1,0 委 7 和 了 B 一 1 
w= | 
A—l<z<M—1B—1l<y<N-—!1 
hry Us 0—10 和 ROED—il 
h.(z,y) -| 
ECE—1<zM— lB N—1 


延 拓 后 ,f/f.(z,y) 和 h(x,y) 分 别 成 为 二 维 周 期 函数 ,在 xz 和 y 方向 上 的 周期 分 别 为 M 
和 N ,与 一 维 离散 系统 类 似 , 则 输出 的 二 维 退 化 数字 图 像 为 
BT39) = DD fmmhlr—m;y—n) (8-13) 
在 该 离散 卷 积 退 化 模型 中 没有 考虑 噪声 项 , 若 考 虑 噪声 的 作用 ,只 需 在 式 (8-13) 后 加 
上 一 个 MXN 的 扩展 离散 噪声 项 n(xz,y), 即 可 得 到 完整 的 二 维 离 散 退化 模型 : 
gzyy) = DD fm mh (rm,y—n) tn(z,y) (8-14) 


式 中 ,x=0,1,2,…,M 一 1; y 一 0,1,2,…,N 一 1。 
与 一 维 离 散 模型 类 似 , 二 维 离 散 退 化 模型 也 可 用 和 矩阵 来 表示 : 
= 
式 中 ,g 和 了 代表 MN 维 列 向 量 , 即 MNX1 维 向 量 ,这 些 列 向 量 是 由 MXN 维 的 函数 矩阵 
了 f(z,y)、g(z,y) 的 行 向 量 一 次 组 成 为 一 维 列 向 量 , 形 式 分 别 为 
f =[f.(0,0)%f. (0 N— 1)f.(1,0)%/f.(1, No— 1) 
fAM—1.0)°f. (M—1.N—1)"] 
g =[g.(0.0)°g.(0,M— 1)g.(1,0)°g.(1,M— 1). 
goCM 一 1.0)…g. (M—1,N—1)7] 
式 中 ,H 是 MN XMN 矩阵 ,矩阵 H 可 表示 为 如 下 M XM 分 块 循环 矩阵 的 形式 , 即 


[Ho] [Hu ] [Hw] we [LH] 
[LH] [Ho] [Hx] i [LH:] 
= | El [i BN [Ed 
[Hy] [LE Eee = [LH] 


其 中 每 一 个 分 块 和 矩阵 H; 是 N XNN 的 矩阵 ,形式 为 
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hjs0) ROGIN—1) … hj,1) 
ty 0 
Hi=| RG32) htsD sm Ba) 


hIN—1) hCGN—2) … hj,0) 

车 考虑 噪声 的 作用 , 则 二 维 离散 退化 模型 可 表示 为 

g=H:. f+n (8-15) 

图 像 复原 的 问题 即 获取 原 图 像 /(x,y) ,因此 ,在 线性 和 空间 位 置 不 变 的 条 件 下 ,图像 复 
原 问题 可 归结 为 获得 退化 系统 的 冲 激 响应 h(xz,y) 和 加 性 噪声 nCz,y) ,然后 ,根据 g 二 H… 
了 十 2 就 可 以 估计 出 理想 图 像 /(z,y)。 

一 个 不 容 忽视 的 问题 是 ,对 于 一 般 的 图 像 复原 ,其 计算 量 是 非常 大 的 。 以 一 般 大 小 的 数 
字 图 像 为 例 ,如 MN==512, 则 和 矩阵 HH 的 大 小 为 M*XM? 二 262 144X262 144。 可 见 , 为 了 
计算 得 到 ,需求 解 262 144 个 线性 方程 组 ,其 计算 量 之 大 是 不 难 想象 的 。 降 低 计算 量 的 主 
要 方法 是 应 充分 利用 循环 矩阵 HH 的 有 关 性 质 。 


8.3 无 约束 复原 


在 已 经 给 定 退 化 图 像 g(z,y) 的 条 件 下 ,图 像 复 原 完 全 取决 于 对 退化 系统 NGCz,y) 及 噪 
声 n(zx,y) 的 了 解 , 从 而 估计 出 原始 图 像 fCz,y)。 实 际 上 ,为 了 保证 估计 的 精度 和 准确 性 ， 
这 类 估计 应 在 某 种 最 佳 准则 下 达到 最 优 性 质 。 例 如 ,在 均 方 误差 最 小 意义 下 ,原始 图 像 
f(z,y) 的 最 佳 估计 。 

目前 ,包括 最 大 绝对 误差 最 小 .平均 绝对 误差 最 小 或 互相 关 为 最 大 等 在 内 的 各 种 估计 准 
则 中 ,相对 而 言 , 均 方 误差 最 小 估计 是 最 简单 易 行 的 方法 ,并 由 此 可 以 导出 其 他 较 实 用 的 复 
原 方法 。 


8.3.1 无 约束 复原 基本 原理 
根据 系统 退化 模型 ,噪声 项 可 以 表示 为 
n=g—H:/ 
在 噪声 ,不 确定 的 情况 下 ,希望 对 原始 图 像 的 估计 值 /应 满足 这 样 的 条 件 ,使 了 在 
最 小 二 乘 方 误差 意义 上 近似 于 g 。 也 就 是 说 ,希望 找到 一 个 三, 使 得 
lnl*= lg 一 互 请 |: = (g 一 百 广 TCg 一 五 户 (8-16) 
为 最 小 (噪声 项 的 范 数 最 小 )。 由 定义 可 知 


| n | = nin 
求 | z | * 最 小 等 效 于 求 上 g 一 六? 最 小 , 即 
J = le—Hfl? (8-17) 


在 这 里 ,除了 要 求 估计 的 f 使 (六 为 最 小 值 以 外 ,不 受 任何 其 他 条 件 的 约束 ,因此 称 为 无 约 
束 复原 方法 。 
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使 J( 放 为 最 小 的 条 件 是 了 (让 对 f 的 微分 为 0, 即 


9 = (8-18) 
af 
因此 ,可 得 
H'Hf = H'g (8-19) 
即 
f= HDiH'g (8-20) 
如 果 过 和 y 方向 上 的 采样 点 数 相同 , 即 M==NN ,HH 为 方 阵 且 H 的 逆 和 矩阵 存在 , 则 
f= HHH'g= Hg (8-21) 


上 式 表明 ,对 退化 图 像 的 复原 估计 中 , 若 退 化 系统 互 已 知 ,就 可 以 根据 式 (8-20) 求 解 出 
原始 图 像 的 均 方 误差 最 小 估计 值 f。 若 五 的 道 矩 阵 存在 , 则 互 -: 已 知 , 可 根据 式 (8-21) 较 


简洁 地 估计 出 原始 图 像 /的 最 佳 估 计 值 刻 即 当 五 逆 作 用 于 退化 图 像 g (zy) 时 ,可 以 实现 
原始 图 像 的 最 小 二 乘 方 误差 最 小 意义 上 的 无 约束 估计 。 


8.3.2 无 约束 复原 的 奇异 性 


从 理论 上 分 析 , 由 于 无 约束 复原 的 处 理 方法 仅 涉 及 代数 知识 ,与 微 积分 运算 无 关 , 因 此 
该 方法 简单 易 行 ,根据 式 (8-21) 可 以 对 退化 图 像 g(z,y) 进 行 复原 。 但 由 于 该 处 理 方法 依赖 
于 矩阵 HH 的 逆 矩 阵 , 该 方法 存在 一 定 的 局 限 性 。 若 吾 矩 阵 奇异 , 则 H7' 不 存在 ,这 时 无 论 是 
五 一 还 是 CH7EBD) 一 都 不 存在 ,就 无 法 通过 式 (8-21) 对 图 像 进行 复原 。 互 道 矩阵 不 存在 时 ,这 
种 现象 称 为 无 约束 复原 方法 的 奇异 性 。 

实际 上 ,无 约束 复原 的 奇异 性 还 可 以 进一步 分 析 , 对 式 (8-21) 进 行 傅 里 叶 变 换 可 得 
Glu,v) 
H(u,v) 


由 此 可 得 ,采用 式 (8-21) 进 行 图 像 复 原 时 ,复原 图 像 的 傅 里 叶 变换 是 基于 退化 图 像 的 
傅 里 叶 变 换 CCu,v) 与 系统 函数 的 傅 里 时 变换 万 (u,v) 之 比值 。 若 如 不 存在 , 则 表明 
于 (u,v) 在 wv 平面 上 的 个 别 点 或 某 些 区 域 其 值 等 于 0, 即 GCusv)/H(usv) 出 现 了 零点 ,这 
时 ,即使 没有 噪声 ,一般 也 无 法 根据 gCz,y) 恢 复原 图 像 fCz,y)。 

需要 指出 的 是 ,有 时 理论 上 G(u,u)/ 瓦 (xu) 并 没有 出 现 零点 , 囊 (x,u) 只 是 接近 于 0， 
这 时 也 可 能 会 导致 复原 模型 的 不 稳定 性 。 这 时 若 系统 存在 噪声 , 则 噪声 项 将 会 放大 。 因 此 ， 
退化 图 像 中 小 的 噪声 干扰 在 厅 (u,v) 取 值 很 小 值 的 那些 频谱 上 将 对 恢复 图 像 产 生 很 大 的 
响 , 严 重 影响 复原 效果 。 


Fl(u,v) = (8-22) 


ES 


8.4 ” 逆 瘦 波 


道 滤波 复原 法 是 无 约束 复原 方法 的 一 种 ,又 称 为 反 向 滤波 复原 法 或 者 去 模糊 。 逆 滤波 
是 通过 变换 到 频 域 进行 滤波 的 ,属于 频 域 图 像 复 原 方法 。 逆 滤波 复原 的 基本 原理 是 根据 图 
像 退 化 的 原因 进行 反 向 滤波 。 
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8.4.1 逆 滤 波 基 本 原理 


设 原始 图 像 为 /(z,y) ,退化 图 像 为 gCz,y) ,在 不 考虑 噪声 对 图 像 退 化 的 影响 下 , 则 系 
统 的 退化 模型 为 


hs = 三 | 一 (8-23) 
根据 傅 里 叶 变 换 的 卷 积 定理 可 得 
Gl(u,v) = H(u,v)F(u,v) (8-24) 


式 中 ,G(s)、H(u,v)、F(u,v) 分 别 是 退化 图 像 g(xz,y)、 点 扩散 函数 h(x,y)、 原 始 图 
像 ACz,y) 的 傅 里 叶 变 换 。 由 式 (8-24) ,可 得 


_ G(u,v) | 
Flusw) — Bee (8-25) 
Hdd = Wl [大 全 (8-26) 


H(u,v) 
式 (8-26) 表 示 了 道 滤波 法 图 像 复原 的 基本 原理 。 在 存在 有 品 声 的 情况 下 , 逆 滤 波 原理 
可 写 为 
Glu,v) = Husw Fu,v) t+ N(u,v) 


Glusw) _ N(u,v) 
Hlusw) H(u,v) 


式 中 ,N(u,v) 是 噪声 n(z,y) 的 傅 里 叶 变 换 。 


8.4.2 逆 滤 波 的 病态 条 件 


利用 式 (8-25) 和 式 (8-27) 进 行 复原 处 理 时 可 能 会 发 生 一 些 奇 异性 , 即 在 wv 平面 上 有 
些 点 或 区 域 会 产生 吾 (x,o)=0 或 刀 (xso) 非 常 小 的 情况 ,在 这 种 情况 下 ,即使 没有 噪声 ,也 
无 法 精确 地 恢复 fCz,y)。 另 外 ,在 存在 噪声 时 ,在 吾 (x,u) 的 某 一 邻 域内 ,HGCusu) 的 值 可 
能 比 N(u,v) 的 值 小 得 多 ,根据 式 (8-27) 可 知 ,噪声 的 影响 可 能 会 非常 大 ,有 时 可 能 也 会 使 
f(x,y) 不 能 正确 恢复 。 

为 了 克服 这 种 不 足 , 可 利用 有 约 东 图 像 复 原 , 也 可 利用 噪声 一 般 分 布 在 高 频 , 即 噪声 
在 高 频 部 分 衰减 速度 较 慢 ,而 信号 的 频谱 随 频 率 升 高 快速 下 降 的 性 质 ,在 图 像 复原 时 ,只 
限制 在 频谱 坐标 离 原 点 不 太 远 的 有 限 区 域内 运行 ,而 且 关 心 的 也 是 信 品 比 高 的 那些 频率 
位 置 。 

一 般 来 说 , 逆 滤 波 方法 不 一 定 能 正确 地 估计 瓦 (zx,u) 的 零点 ,因此 必须 采用 一 个 折 中 的 
方法 加 以 解决 。 实 际 上 , 逆 滤 波 不 是 用 1/ 理 (u,v) ,而 是 采用 另 一 个 关于 u,v 的 函数 M(u,v)。 
其 基本 原理 如 图 8-2 所 示 。 


Fl(u,v) = 


(8-27) 


Nu.v) 


=) Hu,v) 一 | Mu,v) ~ lu, v) 
Flu. wv) G(x, 可 


图 8-2 ” 逆 滤 波 系统 原理 框图 
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若 系统 噪声 xz,y) 一 0, 且 系统 瓦 没有 零点 的 情况 下 , 设 


= 
M(u,v) = yo (8-28) 


实际 上 ,图 8-2 所 示 的 模型 包括 退化 和 恢复 运算 。 退 化 和 恢复 总 的 传递 函数 可 
瑟 (x,u)MCu,u) 来 表示 ,此 时 有 


Fuad) = [HC 0) MC 0) JF CLs0) (8-29) 


式 中 ,f(x,y) 是 (Cz,y) 的 佑 计 值 ; F(a,v) 是 f(z,y) 的 伟 里 叶 变 换 ; 厅 (u,v) 称 为 输入 
传递 函数 ; M(u,v) 称 为 处 理 传递 函数 ; 日 (u,v)M(u,v) 称 为 输出 传递 函数 。 实 际 上 ,为 了 
避免 玉 (u,v) 取 值 太 小 ,一 种 改进 方法 是 在 玉 (u,v)==0 的 那些 频谱 点 及 其 附近 ,可 以 对 
1/H(u,v) 的 值 进行 设置 ,从 而 使 得 在 这 些 频谱 点 附近 NG,v)/ 昌 (uo) 不 会 对 f(z,y) 产 生 
过 大 的 影响 。 

一 般 情况 下 , 态 (u,wv) 的 幅 值 随 着 离 ww 平面 原点 的 距离 的 增加 而 迅速 下 降 ,而 噪声 项 
N(u,v) 的 幅 值 变化 是 比较 平缓 的 。 在 远离 cv 平面 的 原点 时 , N (u,v)/H(u,v) 的 值 就 会 
变 得 很 大 ,而 对 于 大 多 数 图 像 来 说 (u,v) 却 变 小 ,在 这 种 情况 下 ,噪声 反而 占 优势 ,自然 无 
法 满意 地 恢复 出 原始 图 像 。 这 一 规律 说 明 , 应 用 道 滤波 时 仅 在 原点 邻 域内 采用 1/H (u,v) 
才能 奏效 , 换 句 话说 ,考虑 到 退化 系统 的 传递 函数 互 (x,u) 带 宽 比 噪声 的 带宽 要 罕 得 多 ,其 
频率 特性 具有 低 通 性 质 , 应 使 M(u,v) 在 下 述 范 围 内 选择 : 

t= He ed (8-30) 
ll wiv > 

wo 的 选择 应 该 将 及 (u,v) 的 零点 排除 在 此 邻 域 之 外 ,这 种 方法 的 不 足 之 处 是 复原 后 的 

图 像 的 振 铃 效果 较 明 显 。 


8.4.3 逆 滤 波 复原 实例 


例 8-1: 逆 滤 波 图 像 复 原 实验 
MATLAB 程序 代码 如 下 : 


*% 图 像 复原 之 逆 滤 波 程序 代码 


Eles 


clear all; 

image_o = imread( 'C:\Users\chen\Desktop\lena. bmp'); 
subplot(1,3,1); 

imshow( image_ 0); 

title( ' 原 始 图 像 '); 

在 频率 域 进行 图 像 退 化 

g= im2double( image 0); 

G= fft2(g); 

G= fftshift(G); 
多 进行 图 像 退化 

[M,N] = size(G); 

[u,v] =meshgrid(1:M,1:N); 名 生成 二 维 坐标 系 
HB=exp( 一 0.0025* ((u—M/2).*2+(v—N/2).°2).*(5/6)); 
G=G. *H; 


人 
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名 傅 里 叶 反 变换 
X= ifftshift(G); 
x= ifft2(X); 
image degradation = uint8(abs(x) * 256); 
subplot(1,3,2); 
imshow( image_ degradation); 
title( ' 退 化 图 像 '); 
% 逆 滤波 图 像 复原 
ff = im2double( image_degradation) ;将 图 像 灰 度 值 归 一 化 到 0 一 1 之 间 
名 傅 里 叶 变 换 
£f Id= fft2(ff); 
f_Id=fftshift(f_ Id); 
fH Id=f Id; 
[M,N] = size(fH_Id); 
% 逆 滤波 
threshold = 88; 
if threshold> M/2 
fH_Id= fH Id./(H+ eps); 


else 
% 在 一 定 半径 范围 内 进行 滤波 
for i=1:M 
for j=1:N 
if sqrt((i—M/2).*2+(j—N/2).*2)< threshold 
fH_Id(i,j)=f£H_Id(i,j)./(H(i,j) + eps); 
end 
end 
end 
end 
% 进行 傅 里 叶 逆 变换 


fH_Idl = ifftshift(fH Id); 

image_restoration = ifft2(fH_Id1); 

image_restoration = uint8(abs( image restoration) * 255); 
subplot(1,3,3); 

imshow( image_restoration); 


title( ' 滤 波 半径 为 88, 逆 滤 波 复原 图 像 '); 
逆 滤 波 图 像 复 原 效 果 如 图 8-3 所 示 。 


(a) 原始 图 像 (b) 逆 滤 波 图 像 (©) 复原 图 像 
图 8-3 逆 滤 波 图 像 复原 
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8.5 有 约束 复原 法 


为 了 在 数学 上 更 容易 处 理 , 通 常 在 无 约束 复原 方法 的 基础 上 附加 一 定 的 约束 条 件 ,从 而 
在 多 个 可 能 结果 中 选择 一 个 最 佳 结果 ,这 便 是 有 约束 的 复原 方法 。 


8.5.1 最 小 二 乘 类 约束 复原 


无 约束 复原 是 指 除了 使 准则 函数 JCP)=11g 一 巨 广 |* 最 小 外 ,再 没有 其 他 约束 条 件 。 
因此 只 需 了 解 退 化 系统 的 传递 函数 或 点 扩散 函数 万 ,就 能 利用 式 (8-20) 或 式 (8-21) 进 行 复 
原 。 但 是 由 于 传递 函数 也 奇异 性 问题 ,复原 只 能 局 限 在 靠近 原点 的 有 限 区 域内 进行 ,这 就 
使 得 无 约束 图 像 复原 方法 具有 较 大 的 局 限 性 。 

最 小 二 乘 类 约束 复原 是 指 除 了 要 求 了 解 关于 退化 系统 的 传递 函数 也 之 外 ,还 需要 知道 
某 些 噪声 的 统计 特性 或 噪声 与 图 像 的 某 些 相关 情况 。 根 据 所 了 解 的 噪声 的 先 验 知识 的 不 
同 , 应 采用 不 同 的 约束 条 件 , 可 得 到 不 同 的 图 像 复 原 技 术 。 

在 最 小 二 乘 类 约束 复原 中 ,复原 问题 表现 为 在 满足 |? 二 | g 一 瑟 广 | : 的 约束 条 件 下 ， 
要 设法 寻找 一 个 最 优 估 计 广 ,使 得 形式 为 1@ 广 := ‖ 1: 的 函数 最 小 化 。 求 这 类 问题 的 有 
约束 最 小 化 , 常 采用 拉 格 朗 日 乘 数 法 进行 处 理 。 即 寻找 一 个 广 ,使 得 如 下 准则 函数 最 小 。 

J( 六 = 1 六 1 十 Mg 一 互 六 1 一 ll2) CB 


式 中 ,@ 为 /的 线性 算 子 ; 4 为 一 常数 ( 称 为 拉 格 朗 日 乘 子 ) 。 
对 上 式 求 导 ,可 得 


2 .JP =20rof -2MHrg 一 互 户 =0 (8-32) 
af 
= (mutio'o) ms (8-33) 
令 7 一 1 人 
f= (HH+7YQ'O Hg (8-34) 


常数 7 必须 反复 迭代 调整 ,直到 满足 约束 条 件 nn1 ?= | g 一 HH 上。 求解 式 (8-34) 
的 关键 就 是 如 何 选用 一 个 合适 的 变换 矩阵 @。 

相对 于 无 约束 问题 ,有 约束 条 件 的 图 像 复 原 更 符合 图 像 退化 的 实际 情况 ,因此 其 适应 面 
更 加 广泛 。 对 于 式 (8-34) , 若 选择 不 同形 式 的 @ 矩阵 , 则 可 得 到 不 同类 型 的 有 约束 最 小 二 
乘 方 类 图 像 复 原 方法 。 如 果 用 图 像 / 和 噪声 的 自 相关 和 矩阵 Rs 和 R, 表示 Q ,就 可 以 得 到 维 
纳 滤 波 复原 方法 。 如 选用 拉 普 拉 斯 算 子 形式 ,即使 某 个 函数 的 二 阶 导 数 最 小 ,也 可 推导 出 有 
约束 最 小 平方 恢复 方法 。 


8.5.2 维 纳 滤波 
在 一 般 情 况 下 ,图 像 信号 可 近似 为 平稳 随机 过 程 , 维 纳 滤波 的 基本 原理 是 将 原始 图 像 
和 对 原始 图 像 的 估计 看 作 随 机 变量 ,按照 使 了 和 估计 值 /之 间 的 均 方 误差 达到 最 小 的 准则 


第 8 章 ”图 像 复 原 | 有 203 
实现 图 像 复 原 。 因 此 , 维 纳 滤波 器 又 称 为 最 小 均 方 误差 滤波 器 , 均 方 误差 为 
e = E{[f(zsy) fra 
式 中 ,E(。) 表 示 数 学 期 望 。 
设 Ri 和 R, 是 f 和 n 的 自 相关 和 矩阵 ,定义 为 
Rj; = ECffT™) (8-35) 
R, = E(imm'™) (8-36) 


根据 上 述 定义 可 知 ,Rr 和 R， 均 为 实 对 称 和 矩阵 。 在 大 多 数 实际 图 像 中 ,相近 像素 点 是 高 
度 相 关 的 ,而 距离 较 远 的 像素 点 的 相关 性 则 相对 较 弱 。 通 常情 况 下 ,无 论 /还 是 ”其 元 素 
之 间 的 相关 不 会 延伸 到 20 一 30 个 像素 的 距离 之 外 。 因 此 ,一 般 来 说 , 自 相关 和 矩阵 Ri 和 R， 
在 主 对 角 线 附近 有 一 个 非 零 元 素 带 ,而 矩阵 的 右上 角 和 左上 角 的 区 域内 将 接近 零 值 。 如 果 
像素 之 间 的 相关 是 像素 距离 之 函数 ,而 不 是 像素 位 置 的 函数 ,可 将 Ri 和 R, 近似 为 分 块 循 
环 和 矩阵 。 因 而 ,用 循环 矩阵 的 对 角 化 ,可 写成 如 下 形式 
Rr = WAW™ (8-37) 
R, = WBW™ (8-38) 
式 中 ,W 为 MN xMN 矩阵 ,包含 MXM 个 NXN 子 矩阵 。 
以 WG(i,mm) 表 示 W 的 i 行 m 列 分 块 矩 阵 , 则 


WOism) = ei Wy ism=0,1,2,.…,M—1 (8-39) 
Wn 是 NXN 和 矩阵 ,以 W(k,n) 表 示 k 行 n 列 元 素 , 则 有 
WN (ksn) = ee psn= 051;2,°%…,M—1 (8-40) 


矩阵 A、B 的 元 素 分 别 为 矩阵 Rr 和 R, 中 的 自 相 关 元 素 的 傅 里 叶 变换 ,这 些 自 相 关 的 传 
里 叶 变 换 分 别 定义 为 f(z,y) 和 n.(z,y) 的 谱 密 度 Py(u,v) 和 P, (u,v)。 

维 纳 滤波 器 可 以 由 式 (8-34) 导 出 ,定义 QTQ 二 RF'R, ,代入 (8-34) 有 

f= (HT'H+IRIR,) Hg 
= (WD’ DW + yWAT' BW ) "WD Wg 
因此 可 得 
VW f= (DD+M7B) Dwg (8-41) 
车 M==N, 则 有 


FyW= 


H* (u,v) 
和 P, (u,v)) |G(u,v) 
| 再 (xuo) |:+7Y Pn 


1 | H(u,v) |? 
= | H(u,v) [iW |: ye)) Gl(usw) uv=0,1,2,.%…,N—1 
Pj(u,v) 


(8-42) 
若 ;一 1, 则 称 为 维 纳 滤 波 器 , 当 无 噪声 影响 时 ,由 于 P, (u,v) 二 0, 则 退化 为 逆 滤 波 器 ， 
又 称 为 理想 的 道 滤波 器 ,因此 ,着 滤 波 器 是 维 纳 滤 波 器 的 一 种 特殊 情况 。 需 要 注意 的 是 ， 


7 一 1 并 不 是 在 有 约束 条 件 下 的 最 佳 解 , 此 时 并 不 满足 约束 条 件 nl ?二 1g 一 HH 了。 若 y 
变 参 数 , 则 称 为 变 参数 维 纳 滤波 器 。Slepian 将 维 纳 去 卷 积 推广 用 于 处 理 包 括 大 气 扰动 引起 
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的 随机 点 扩散 函数 的 情况 ,随后 ,Pratt 和 Habibl 还 提出 了 提高 维 纳 去 卷 积 计算 效率 的 


方法 。 
维 纳 去 卷 积 提供 了 一 种 在 有 噪声 情况 下 导出 去 卷 积 传递 函数 的 最 优 方 法 ,但 如 下 三 个 
问题 限制 了 它 的 有 效 性 。 


(1) 当 图 像 复 原 的 目的 是 供 人 观察 时 , 均 方 误差 (MSE) 准 则 并 不 是 一 个 特别 好 的 优化 
准则 。 这 是 因为 MSE 准则 不 管 其 在 图 像 中 的 位 置 对 所 有 误差 都 赋 以 同样 的 权 , 而 人 眼 则 
对 暗 处 和 高 梯度 区 域 的 误差 比 其 他 区 域 的 误差 具有 和 较 大 的 容忍 性 。 由 于 使 均 方 误差 最 小 
化 , 维 纳 滤波 器 以 一 种 并 非 最 适合 人 眼 的 方式 对 图 像 进行 了 平滑 。 

(2) 经 典 的 维 纳 去 卷 积 不 能 处 理 具有 空间 可 变 点 扩散 函数 的 情形 ,如 存在 在 差 、 散 差 、 
表面 像 场 弯曲 以 及 含 旋转 的 运动 模糊 等 情况 。 

(3) 这 种 技术 不 能 处 理 非 平稳 信号 和 噪声 的 一 般 情 形 。 许 多 图 像 都 是 高 度 非 平稳 的 ， 
有 着 被 陡峭 边缘 分 开 的 大 块 平坦 区 域 。 此 外 ,一 些 重要 的 噪声 源 具 有 与 局 部 灰 度 有 关 的 特 
性 。 维 纳 滤波 图 像 复 原 效果 如 例 8-2 所 示 。 

例 8-2: 维 纳 滤波 图 像 复原 效果 

图 8-4(a) 为 原始 图 像 ,图 8-4(b) 为 卷 积 模糊 图 像 , 图 8-4(c) 是 采用 有 约束 维 纳 滤波 器 

方法 对 图 8-4(b) 所 示 的 退化 图 像 进行 滤波 ,得 到 的 复原 图 像 。 通 过 该 实验 可 以 看 出 ,因为 
卷 积 模糊 ,图像 质量 明显 下 降 , 经 过 维 纳 滤波 器 复原 以 后 ,图 像 在 清晰 度 和 明亮 程度 上 也 有 
较 大 幅度 提升 。 


未 


(a) 原始 图 像 (b) 卷 积 模糊 图 像 (0) 复原 图 像 
图 8-4 有 约束 图 像 复 原 


8.5.3 功率 谱 均 衡 


维 纳 滤波 器 是 按照 使 /(zx,y) 和 估计 值 /(z,y) 之 间 的 均 方 误差 达到 最 小 的 准则 实现 图 

像 复 原 的 ,车 改变 上 述 准则 ,使 原始 图 像 /(z,y) 的 功率 谱 Pj(u,v) 和 图 像 估计 值 / (zx,y) 的 
功率 谱 PF(u,v) 相 等 , 则 称 为 功率 谱 均 衡 复 原 方法 , 即 
Pj(usv) = PF(u,v) 


根据 上 述 准则 ,Cannon 首先 导出 ,如 下 形式 的 滤波 器 可 使 退化 图 像 的 功率 谱 复原 至 其 
原先 的 幅度 , 即 


G(u.v) 


[ Pj(u,v) 


Ty oo pod | | 


到 
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与 维 纳 滤波 器 类 似 , 式 (8-43) 所 示 的 功率 谱 均衡 滤波 器 也 是 无 相 移 的 实 偶 函 数 , 它 可 
用 于 无 相 移 或 相 移 可 用 其 他 方法 确定 的 模糊 传递 函数 。 

功率 谱 均 衡 滤 波 器 (8-43) 与 维 纳 滤 波 器 是 十 分 相似 的 。 当 无 噪声 时 ,这 两 处 滤波 器 都 
简化 为 逆 滤 波 器 ( 即 直 接 的 去 卷 积 ); 当 无 信号 时 ,这 两 种 滤波 器 都 完全 截止 。 然 而 ,不 同 的 
是 功率 谱 均 衡 滤波 器 在 模糊 传递 函数 瓦 (xu) 为 零 处 并 不 截止 到 零 。 

功率 谱 均 衡 滤 波 器 具有 相当 强 的 图 像 复 原 能 力 ,在 某 些 情况 下 其 性 能 优 于 维 纳 滤波 器 。 
功率 谱 均 衡 滤波 器 有 时 也 称 为 同 态 滤波 器 。 


8.5.4 几何 均值 滤波 器 
分 析 如 下 形式 的 复原 滤波 器 传递 函数 ， 


过 
| 


和 H* (u,v) pe 
G(u,v) = [raes Fr] | Ho | + yD (8-44) 
Pj(u,v) 


式 中 ,a 和 7 为 正 的 实 常数 。 该 滤波 器 可 以 认为 是 前 面 讨论 过 的 几 种 滤波 器 的 一 般 形 
式 , 传 递 函数 中 包含 参数 a 和 7Y。 当 a=1 时 , 式 (8-44) 就 成 为 去 卷 积 滤波 器 ; 车 a 二 1/2,7=1， 
则 式 (8-44) 就 成 为 功率 均衡 滤波 器 。 

进一步 分 析 还 可 发 现 a==1/2 时 , 式 (8-44) 定 义 的 是 普通 去 卷 积 和 维 纳 去 卷 积 的 几何 平 
均 ,由 此 可 以 看 出 ,几何 均值 滤波 器 是 基于 道 滤波 和 维 纳 滤 波 器 的 进一步 改进 。 因 此 ,可 以 
称 式 (8-44) 所 定义 的 滤波 器 为 几何 均值 滤波 器 。 

在 式 (8-44) 中 ,车 a 二 0, 就 可 得 到 如 下 参数 化 的 维 纳 滤 波 器 : 
H* (u,v) 


和; P, (u,v) 
| H(u,v) | Te 


当 Y=1 时 , 它 就 成 了 维 纳 滤波 器 ; 而 当 7 二 0 时 , 它 就 变 成 了 单纯 的 去 卷 积 。 一 般 来 
说 ,可 通过 选择 7 的 数值 来 获得 所 希望 的 维 纳 平 滑 效 果 。 

式 (8-44) 代 表 一 个 很 一 般 的 复原 滤波 器 ,可 用 于 具有 线性 与 空间 不 变 的 模糊 函数 以 及 
具有 加 性 ,不 相关 噪声 的 复原 。 在 存在 轻微 模糊 的 适度 噪声 条 件 下 ,Andlews 和 Hunt 对 
式 (8-44) 所 定义 的 滤波 器 的 复原 能 力 进 行 了 研究 ,两 人 的 研究 结果 表明 ,单纯 去 卷 积 滤波 
器 的 效果 最 差 ; 而 维 纳 滤波 器 会 产生 人 眼 可 观察 到 的 较 严 重 的 低 通 滤波 效应 。 在 同样 条 件 
下 ,Y<1 的 参数 化 维 纳 滤波 和 几何 均值 滤波 器 则 可 以 给 出 更 满意 的 效果 。 


G(u,v) (8-45) 


8.6 匀速 直线 运动 的 模糊 恢复 

8.6.1 匀速 运动 模糊 模型 

在 获取 图 像 时 ,由 于 景物 和 摄像 机 之 间 可 能 会 产生 相对 运动 ,往往 造成 图 像 的 模糊 。 由 
于 匀速 直线 运动 是 其 他 运动 的 基础 ,也 是 合成 其 他 复杂 运动 的 成 分 。 因 此 ,一 般 情况 下 , 均 


匀 直 线 运 动 所 造成 的 模糊 图 像 的 恢复 问题 更 具有 应 用 价值 和 普遍 意义 。 由 于 匀速 运动 退化 
(模糊 ) 后 的 图 像 可 表示 为 


了 
glx,y) | fx — zolD) sy — yolt)) dt (8-46) 
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这 就 是 成 像 具 有 相对 运动 时 的 图 像 退化 模型 ,其 中 g (x,y) 为 模糊 图 像 ,xo(z) 、yo(2) 分 
别 为 图 像 fFCz,y) 在 和 >y 方向 上 的 变化 分 量 ,: 为 运动 时 间 。 
8.6.2 义 速 运动 复原 方法 
对 上 述 运动 退化 模型 进行 传 里 叶 变换 可 得 
G(u,v)= 三 [gre dedy 


二 | 证 | 证 {Dy De drdy)d (8-47) 
令 
Huiv) = [Wl 
根据 传 里 叶 变 换 的 性 质 , 对 上 式 进一步 推导 可 得 
GCuyu) = Hl(u,w) Fu,v) (8-48) 
上 式 就 是 运动 退化 模型 的 全 里 叶 变 换 形式 ,由 此 可 知 ,车 已 知 函数 zo C(t) 和 yo (2) 的 性 
质 , 则 可 以 恢复 原 图 像 /(zx,y)。 
如 果 模 糊 图 像 是 因为 景物 在 z 方向 的 匀速 直线 运动 而 产生 , 则 模糊 后 图 像 任 意 点 的 灰 
度 值 可 表示 为 
SCzyy) 一 | /te ~ ,yl (8-49) 
式 中 ,zo(1) 是 景物 在 工 方向 上 的 运动 分 量 。 
设 图 像 在 工 方向 的 总 位 移 为 & ,总 的 运动 时 间 为 工 ,可 得 
at 


Xo ll) Sy (8-50) 


若 只 考虑 工 方向 的 运动 , 则 yo (4) 二 0, 于 是 可 得 


2 
蔬 Gw 二 二 | -iaruro (DHyoD)) dy 
0 


本 
-ix 
= | erizrtxoto) dr 
0 


一 nd (8-51) 
Nau 
经 推导 可 得 ,水 平方 向 的 匀速 直线 运动 产生 的 图 像 模糊 的 数学 模型 为 
g(xX»y) = [Ee a (8-52) 


其 恢复 近似 公式 为 
f(zy) TA— mE Je’ [= it 过 ] + 3 本 二 让 0 疝 (8-53) 
式 中 ,g 表示 求 导数 运算 。 
同样 的 方法 ,假定 xo(7) 二 0, 可 以 恢复 重 直 方向 匀速 直线 运动 所 产生 的 图 像 模糊 ,其 图 
像 模 糊 模 型 及 近似 恢复 公式 为 
ee =|/[z'y 一 条] 和 (8-54) 


出 
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zy) A int[ 三 je int(E)]}+ Dae, —&)] (8-55) 
式 中 ,6 为 图 像 在 y 方向 的 总 位 移 。 
车 zz 方向 和 y 方向 均 有 运动 变化 , 则 有 
ee 
T 


H(wd) = a Sin CnCau 十 bv))e ir(etto) (8-57) 


8.7 其 他 纠正 技术 

当 图 像 退 化 系统 中 缺乏 对 退化 系统 的 了 解 ,无 法 确定 图 像 的 系统 函数 时 ,就 必须 采取 其 
他 方法 对 图 像 进行 复原 。 

8.7.1 几何 畸变 校正 


数字 图 像 在 获取 过 程 中 常常 由 于 成 像 系 统 的 几何 非 线 性 误差 ,导致 图 像 产生 几何 失真 。 
例如 ,成 像 图 像 与 原 景物 (或 物体 ) 图 像 相 比 可 能 出 现 了 比例 失调 ,甚至 扭曲 等 现象 ,这 类 图 
像 退化 现象 一 般 称 为 图 像 的 几何 畸变 。 如 图 8-5 所 示 是 几 种 常见 的 几何 失真 情况 。 


(a) 原始 图 像 (b) 梯形 失真 (c) 枕 形 失真 
图 8-5 几 种 典型 的 几何 失真 


几何 畸变 校正 的 目的 是 需 对 失真 的 图 像 进行 精确 的 几何 校正 ,通常 是 先 确定 一 幅 图 像 
为 基准 ,然后 去 校正 男 一 幅 图 像 的 几何 形状 。 因 此 ,几何 畸变 校正 一 般 分 两 步 进 行 : 第 一 步 
是 图 像 空 间 坐 标的 变换 ; 第 二 步 是 重新 确定 在 校正 空间 各 像素 点 的 取 值 。 

1. 空间 几何 坐标 变换 

按照 一 幅 标准 图 像 g(u.v) 或 一 组 基准 点 去 校正 另 一 幅 几 何 失真 图 像 (z,y), 称 为 空 
间 几 何 坐标 变换 。 根 据 几何 变换 理论 , 即 根据 两 幅 图 像 的 一 些 已 知 对 应 点 对 或 控制 点 对 建 
立 起 映射 关系 ,将 失真 图 像 的 二 > 坐标 系 变换 到 标准 图 像 w-v 坐标 系 , 从 而 实现 失真 图 像 按 
标准 图 像 的 几何 位 置 校正 ,使 A(z,y) 中 的 每 一 像 点 都 可 在 gCu,v) 中 找到 对 应 像 点 。 
2. 三 角形 线性 法 
图 像 的 几何 失真 虽然 是 非 线性 的 ,但 在 一 个 很 小 的 局 部 区 域内 可 近似 认为 是 线性 的 。 
基于 这 一 假设 ,将 标准 图 像 和 被 校正 图 像 之 间 的 控制 点 对 划分 成 一 系列 小 三 角形 区 域 , 三 角 
形 顶 点 为 三 个 控制 点 。 根 据 几何 变换 理论 ,在 三 角形 区 内 满足 以 下 线性 关系 ， 
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r=au+t+bvte 
(8-58) 


y=dutev+tf 
若 三 个 控制 点 对 在 两 个 坐标 系 中 的 位 置 分 别 为 (zi,yi)、(Czsyy)、 (zs,y) 和 (wayu)、 
(xzyz)、 (Csyus), 因 此 ,应 用 以 下 校正 线性 方程 组 进行 校正 。 
Zi 一 au 十 加 :十 c 
Xz 一 atlz 十 pos 十 c 
Xs 一 atus 十 bs 十 c 


(8-59) 
y= dutev+t+f 


J dus evsti+f 


3 dus eU3 基 

通过 求解 上 述 方程 组 求 出 a、b、c.d、e、f 六 个 系数 ,利用 式 (8-58) 对 该 三 角形 区 内 其 他 
像 点 进行 校正 。 同 样 的 方法 ,求解 不 同 的 三 角形 区 域 校正 方程 组 ,对 不 同 区 域 进行 几何 
校正 。 

三 角形 区 域 线 性 方程 组 求解 法 不 需要 了 解 退 化 系统 的 系统 函数 ,通过 观察 失真 图 像 , 划 
分 有 特征 的 几何 畸变 三 角形 区 域 , 采 用 计算 机 求解 线性 方程 组 ,简单 易 行 ,能 满足 某 些 特性 
的 几何 畸变 情况 ,并 具有 一 定 的 校正 精度 。 

需要 注意 的 是 ,这 是 以 局 部 小 范围 内 的 线性 校正 方法 去 处 理 大 范围 内 的 非 线 性 失真 ,所 
以 三 角形 区 域 的 数量 不 能 过 少 。 一 般 情况 下 ,所 选择 的 控制 点 对 越 多 ,分 布 越 均匀 ,三 角形 
区 域 的 面积 越 小 , 则 校正 的 精度 越 高 。 但 是 控制 点 过 多 又 会 导致 计算 量 的 增加 ,因此 需要 根 
据 退 化 图 像 的 具体 情况 综合 考虑 区 域 的 划分 或 控制 点 对 的 数量 。 

3. 灰 度 值 的 确定 

理想 状态 下 ,几何 畸变 图 像 经 校正 以 后 ,在 校正 空间 中 各 像 点 的 灰 度 值 等 于 被 校正 图 像 
对 应 点 的 灰 度 值 。 但 经 过 校正 后 ,图 像 的 一 些 像素 点 因为 位 置 的 变化 可 能 会 拉 伸 ( 分 散 ) 或 
压缩 ,不 一 定 都 恰好 落 在 坐标 的 整数 点 上 ,这 时 需要 采用 几何 变换 方法 中 的 内 插 法 或 其 他 方 
法 来 获得 这 些 像素 点 的 灰 度 值 。 

具体 插值 方法 的 选择 应 根据 图 像 的 特点 、 灰 度 值 分 布 情况 等 因素 ,恰当 选择 最 近邻 点 
法 、 双 线性 插值 法 或 三 次 内 插 法 等 几何 变换 方法 。 


8.7.2 ”盲目 图 像 复 原 


目 图 像 复 原 法 是 指 在 没有 图 像 退 化 先 验 知识 、 对 退化 系统 了 解 不 足 的 条 件 下 ,通过 观 
察 退化 图 像 的 多 个 图 像 并 以 某 种 方式 抽出 退化 信息 ,进行 图 像 复 原 的 方法 。 在 这 种 条 件 下 ， 
具有 加 性 噪声 的 模糊 图 像 复 原 一 般 有 直接 测量 法 和 间接 估计 法 两 种 方法 。 

1. 直接 测量 法 

采用 直接 测量 法 盲目 复原 图 像 时 ,需要 测量 图 像 的 模糊 脉冲 响应 和 噪声 功率 谱 或 协 方 
差 郴 数 (矩阵 ) 。 在 所 观察 的 景物 中 ,点 光源 能 量 往往 直接 指示 出 冲 激 响应 。 此 外 ,图 像 边缘 
陡峭 与 否 也 能 用 来 推测 模糊 冲 激 响应 。 一 般 的 经 验 是 ,在 背景 亮度 相对 恒定 的 区 域内 测量 
图 像 的 协 方差 .可 以 估计 出 观测 图 像 的 噪声 协 方差 函数 或 矩阵 。 

2. 间接 估计 法 

间接 估计 法 复原 图 像 类 似 于 多 图 像 平均 处 理 法 。 如 对 一 个 景物 连续 拍摄 N 次 , 若 每 一 


下 
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次 获取 的 图 像 可 表示 为 
SiCryy) 一 Cry) 十 mr(Czy) 1 一 1,2.3,…, 入 (8-60) 
式 中 ,f(z,y) 表 示 原 始 图 像 ; gi(zx,y) 表 示 第 i 次 获取 的 图 像 ; ni;(z,y) 表 示 第 i 次 获取 图 像 
中 的 噪声 。 
对 上 述 N 次 图 像 求 平均 ,有 
zy) = Nec, 一下 (x,y) (8-61) 


由 于 一 般 情 况 下 噪声 六 (zy) 是 白色 高 斯 噪声， 当 观 察 次 数 较 多 时 ,其 所 有 点 上 的 数学 
期 望 为 0。 由 此 可 得 


N 
et Ns) (8-62) 


上 式 表明 ,通过 适当 次 数 的 观察 退化 图 像 ， 然后 进行 求 平均 运算 ,可 以 获取 真实 图 像 。 
此 外 ,盲目 图 像 复 原 的 间接 估计 法 也 可 以 利用 时 间 上 平均 的 概念 去 掉 图 像 中 的 模糊 。 


8.8 ”中 值 滤波 


中 值 滤波 可 以 用 于 因 脉 冲 噪 声 等 原因 而 引起 的 退化 图 像 的 复原 。 中 值 滤波 是 一 种 非 线 
性 信号 处 理 方 法 ,是 由 J W. Tuky 在 1971 年 提出 的 , 它 可 以 克服 线性 滤波 如 最 小 均 方 滤 
波 ,均值 滤波 给 图 像 边 缘 带 来 的 模糊 ,可 以 既 去 除 噪声 又 能 保护 图 像 的 边缘 ,从 而 获得 较 满 
意 的 图 像 复 原 效果 。 而 且 , 中 值 滤波 在 实际 运算 过 程 中 不 需要 图 像 的 统计 特性 ,这 也 带 来 不 
少 方便 。 但 对 一 些 细节 多 ,特别 是 点 、 线 、 尖 顶 细 节 较 多 的 图 像 不 宜 采用 中 值 滤波 的 方法 。 


8.8.1 中 值 滤波 基本 原理 


中 值 滤波 的 原理 非常 简单 ,就 是 对 一 个 滑动 窗口 (含有 奇数 点 ) 内 的 所 有 像素 灰 度 值 排 
序 , 并 用 其 中 值 代替 窗口 中 心 像素 的 原来 灰 度 值 。 假 设 窗口 内 有 5 个 点 :其 值 分 别 为 80、 
90、200、110、120, 那 么 此 窗口 内 各 点 的 中 值 即 为 110。 

设 有 一 个 一 维 序列 zi ,x ，,… ,Zz,, 取 窗口 长 度 为 m(m 为 奇数 ), 对 此 一 维 序列 进行 中 值 
滤波 ,就 是 从 输入 序列 中 相继 抽出 mm 个 数 二 ,zy za 其 中 心 为 窗口 中 心 点 值 ， 
2 一 (一 1)/2。 然 后 将 这 m 个 点 按 其 数值 大 小 排序 ， 取 序 列 的 中 值 作为 滤波 输出 {y ) , 即 

y; = Med{lzi} 一 Med{(zyziy…yzao) iEN (8-63) 
例如 ,车 有 以 下 输入 序列 : 

{xz}={0008002320232035308530023455555000} 

序列 中 8 是 脉冲 噪声 ,中 间 一 段 为 振荡 ,后面 是 一 段 斜坡 和 跳 变 ,如 采用 长 度 为 3 的 滤 
波 窗口 , 则 滤波 的 结果 为 

{yi}—1000000222222223338333002345555500 0 

显然 ,经 中 值 滤波 后 ,脉冲 噪声 8 被 瀑 掉 了 ,振荡 被 平滑 掉 了 ,和 斜坡 和 阶 跃 部 分 被 保存 了 
下 纺 

如 图 8-6 所 示 , 分 别 应 用 5 个 像素 的 窗口 (m= 二 5) 对 阶 路 函数 ,斜坡 函 数 、 单 脉冲 函数 、 
双 脉 冲 函数 \ 三 脉冲 函数 \ 三 角形 函数 等 几 种 基本 信号 进行 中 值 滤波 和 均值 滤波 ,图 中 左边 
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一 列 为 原始 信号 ,中 间 一 列 为 均值 滤波 结果 ,右边 一 列 为 中 值 滤波 结果 。 


UL 


(a) 阶 跃 信号 

| | | | ul 
(b) 斜坡 信号 

oy [1111111 11111111 
(0) 单 脉冲 信号 

P| RT LN 


a | 
TU 


输入 信号 


ll 


了 | 


中 值 滤波 


| | 


(1) 三 角形 信号 
均值 滤波 


图 8-6 ”中 值 滤波 和 均值 滤波 比较 


图 8-6(a) 和 (b) 的 滤波 结果 表明 ,经 中 值 滤波 器 作用 后 , 阶 跃 函 数 和 和 斜坡 函数 保持 不 
变 ; 图 8-6(c)、(d) 和 (e) 的 滤波 结果 表明 ,经 中 值 滤波 器 作用 后 ,周期 小 于 m/2( 窗 口 之 半 ) 
的 脉冲 将 受到 抑制 ; 而 图 8-6(f) 表 明 ,经 中 值 滤波 器 作用 后 ,三 角形 顶部 变 平 。 
中 值 滤波 的 概念 很 容易 推广 到 二 维 数字 图 像 , 设 (zj (i,j) ET) 表 示 图 像 中 各 点 的 灰 度 
值 ,滤波 窗口 为 A 的 二 维 中 值 滤 波 可 定义 为 
5 = Med{zxs)} (8-64) 
二 维 中 值 滤波 的 窗口 形状 和 尺寸 设计 对 滤波 的 效果 影响 较 大 ,不 同 的 图 像 内 容 和 不 同 
的 应 用 要 求 , 往 往 采 用 不 同 的 窗口 形状 和 尺寸 。 如 图 8-7 所 示 为 几 种 二 维 中 值 滤波 窗口 形 
状 , 常 用 的 有 方形 、 圆 形 、 十 字形 等 。 窗 口 大 小 一 般 由 3 到 5 逐步 增 大 ,直到 获得 满意 的 滤波 
效果 为 止 。 
一 般 情况 下 ,对 于 有 组 变 的 较 长 轮廓 线 物体 的 图 像 ,采用 方形 或 圆 形 为 宜 ; 对 于 包含 有 
尖顶 角 物 体 的 图 像 ,适宜 用 十 字形 窗口 。 而 窗口 大 小 则 以 不 超过 图 像 中 最 小 有 效 物 体 的 尺 
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图 8-7 常用 中 值 滤波 窗口 


才 为 宜 。 使 用 二 维 中 值 滤波 需要 引起 注意 的 是 要 保持 图 像 中 有 效 的 细 线 状 物体 ,如 果 图 像 
中 点 、 线 、 尖 角 细 节 较 多 , 则 不 宜 采 用 中 值 滤波 。 


8.8.2 中 值 滤波 特性 


1 中 值 滤波 对 特定 输入 信号 的 不 变性 
对 一 些 特定 的 输入 信号 ,例如 当 被 滤波 信号 在 窗口 内 单调 增加 或 单调 减少 的 序列 ,中 值 
洪波 输出 信号 具有 不 变性 。 
2 中 值 滤波 的 去 噪声 特性 
对 于 零 均值 正 态 分 布 的 噶 声 输入 信号 ,中 值 江波 后 的 只 志方 差 近似 为 
二 = a 


4mf’* (m) i “2 oy 
式 中 ,of 表示 输入 噪声 功率 (方差 ); m 表示 中 值 滤波 窗口 长 度 ; mm 表示 输入 噪声 均值 ; 


/(m) 表 示 输 入 信号 噪声 密度 函数 。 
根据 上 式 可 知 , 中 值 滤波 的 输出 与 输入 噪声 的 密度 分 布 直 接 相关 。 同 样 可 以 得 出 ,均值 
滤波 的 输出 噪声 方差 ve 为 


Gwe = Lo? (8-66) 
m 


比较 上 述 两 式 可 以 得 出 ,对 于 随机 噪声 的 抑制 能 力 , 中 值 滤波 比 均值 滤波 略 差 , 而 对 于 
脉冲 干扰 ,特别 是 脉冲 宽度 小 于 m/2 及 相距 较 远 的 窄 脉冲 干扰 ,中 值 滤波 的 性 能 要 好 于 均 
值 滤波 。 

3. 中 值 滤波 的 频谱 特性 

一 般 情况 下 ,信号 经 中 值 滤波 之 后 ,其 均值 较为 平坦 ,频谱 特性 起 伏 不 大 。 因 此 ,可 以 近 
似 认 为 ,经 中 值 滤波 之 后 ,信号 频谱 近似 保持 不 变 。 


8.8.3 加 权 中 值 滤波 


上 述 中 值 滤波 方法 ,窗口 内 各 点 对 输出 结果 的 作用 是 相同 的 ,如 果 和 希望 强调 中 间 点 或 中 
间 几 个 点 (或 距 中 间 最 近 的 若干 点 ) 的 作用 :可 以 采用 加 权 中 值 滤波 方法 。 如 果 适 当地 选取 
窗口 内 各 点 的 权重 ,加 权 中 值 滤波 比 简单 中 值 滤波 能 更 好 地 从 被 噪声 污染 的 图 像 中 恢复 出 
阶 跃 边缘 以 及 图 像 的 其 他 细节 。 
加 权 中 值 滤波 的 基本 原理 是 改变 窗口 中 变量 的 个 数 , 可 以 使 一 个 以 上 的 变量 等 于 同一 
点 的 值 , 然 后 对 扩张 后 的 数字 集 求 中 值 。 以 窗口 为 3 的 一 维 加 权 中 值 滤波 为 例 , 可 表示 为 
yi= Weight_ Med{zx;} = Weight_ Med{z;1 ,Ti Tn} 
= Med{Zzi1 Ti TioTioTioTHh Tn} i€EN (8-67) 
在 窗口 内 ,中 间 点 取 奇 数 ,两 边 点 取 对 称 数 ,即位 于 窗口 中 间 的 像素 重复 两 次 ,位 于 窗口 
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边缘 的 两 个 像素 各 重复 一 次 ,组 成 新 的 序列 ,然后 对 新 的 序列 再 按 常规 中 值 滤波 方法 进行 
处 理 。 


习题 


. 试 简 述 导致 图 像 质 量 退 化 的 原因 通常 有 哪些 。 
. 图像 复 原 与 图 像 增强 有 哪些 主要 区 别 ? 
. 试 简 述 图 像 复原 的 基本 原理 。 
.什么 是 图 像 退 化 模型 的 冲 激 响应 函数 ? 
. 试 写 出 一 维 离散 退化 模型 的 矩阵 形式 。 
. 降低 图 像 退化 模型 复原 处 理 的 运算 量 一 般 有 哪些 主要 方法 ? 
. 什么 是 无 约束 复原 ?其 基本 原理 是 什么 ? 
. 无 约 东 复原 的 奇异 性 对 图 像 复 原 有 哪些 影响 ? 
. 简 述 如 何 克 服 图 像 复原 过 程 中 的 奇异 性 影响 。 
10. 什么 是 有 约束 复原 ? 一 般 在 什么 条 件 下 选择 有 约束 复原 ? 
11. 什么 是 逆 滤 波 图 像 复 原 法 ? 它 的 基本 原理 是 什么 ? 
12. 选择 一 幅 图 像 , 根 据闻 滤波 原理 编写 MATLAB 程序 ,对 图 像 进行 道 滤波 复原 , 观 
察 不 同 滤波 半径 的 复原 效果 。 
13. 试 简 述 有 哪些 因素 会 影响 维 纳 滤波 的 有 效 性 ? 
14. 编写 MATLAB 程序 实现 对 图 像 的 维 纳 滤 波 ,分 析 维 纳 滤 波 效 果 。 
15. 试 对 图 8-8 进行 3X3 的 中 值 滤波 处 理 ,并 分 析 处 理 结果 。 
1 7 性 
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1 8 
图 8-8 对 图 形 进行 中 值 滤波 处 理 
16. 根据 中 值 滤波 的 基本 原理 ,分 析 中 值 滤 波 的 主要 功能 有 哪些 。 


17. 什么 是 图 像 的 几何 畸变 ? 如何 消除 图 像 的 几何 畸变 ? 
18. 什么 是 盲目 图 像 复 原 ? 盲目 图 像 复 原 有 哪些 方法 ? 


第 9 章 图 像 编 码 


CHAPTER 9 


图 像 编 码 也 称 图 像 压缩 ,是 指 在 保证 一 定 质量 ( 信 噪 比 或 主观 评价 ) 的 条 件 下 ,按照 一 定 的 
规则 、 以 较 少 比特 数 表示 源 图 像 的 一 种 方法 。 信 息 科 学 的 奠基 人 香农 早已 论证 ,不 论语 音信 号 
还 是 图 像 信号 ,信号 中 都 包含 很 多 元 余 信息 。 图 像 中 常见 的 各 种 元 余 信息 主要 包括 空间 元 余 、 
时 间 宛 余 、 信 息 焙 元 余 、 结 构 宛 余 、` 知 识 宛 余 等 ,这 就 使 得 通过 编码 来 进行 压缩 成 为 了 可 能 。 

数字 图 像 相 对 于 模拟 图 像 ,具有 很 多 优点 , 它 不 仅 能 最 大 限度 地 避免 各 种 噪声 和 干扰 ， 
而 且 便于 利用 计算 机 进行 处 理 和 进行 信息 传输 与 交换 ,可 以 方便 地 对 图 像 进 行 压 缩 ` 增 强 、 
恢复 ,特征 提取 和 识别 等 一 系列 处 理 。 图 像 信息 存在 的 最 大 问题 是 数据 量 非 常 庞 大 ,庞大 的 
数据 量 给 计算 机 存储 系统 .处 理 系统 、 数 据 传输 系统 都 提出 了 新 的 挑战 。 一 幅 分 辩 率 为 
1024X768 的 RGB 彩色 图 像 ,各 单 色 像 素 需要 采用 8 位 表示 , 它 的 数据 量 为 1024 X768X 
8X3bit, 数 据 量 超过 2. 25MB。 因 此 ,如 何 快速 有 效 地 对 图 像 进行 编码 及 图 像 数 据 的 存储 和 
传输 ,成 为 了 信息 技术 的 一 个 研究 热点 和 重点 。 

数字 图 像 庞 大 的 数据 量 给 计算 机 存储 系统 ,处 理 系统 、 数 据 传输 系统 都 提出 了 新 的 挑 
战 ,因此 ,必须 根据 图 像 数据 的 特点 对 其 进行 压缩 编码 。 实 际 上 ,数字 图 像 信息 具有 很 大 的 
压缩 潜力 ,因为 数字 图 像 中 像素 与 像素 之 间 无 论 在 行 还 是 列 方向 上 的 数据 都 存在 较 大 的 相 
关 性 ,并 考虑 到 人 类 视觉 特性 对 彩色 的 敏感 存在 一 定 的 局 限 性 ,所 以 完全 可 以 将 数字 图 像 中 
的 这 部 分 完 余 信息 去 掉 , 即 允许 在 一 定 限度 失真 的 前 提 下 ,按照 某 种 方法 对 图 像 数 据 进行 压 
缩 。 本 章 将 围绕 图 像 编码 的 基本 原理 ,介绍 图 像 数 据 的 霍 夫 曼 编码 、 香 农 一 范 诺 编码 、 行 程 
长 度 编码 .算术 编码 .位 平面 编码 .预测 编码 .变换 编码 JPEG 编码 标准 及 MPEG 编码 标准 
等 多 种 编码 方法 。 


9.1 图 像 编 码 的 基本 原理 


编码 是 信息 科学 的 经 典 研究 课题 .应 用 计算 机 进行 图 像 处 理 必须 首先 进行 图 像 数 字 化 ， 
而 图 像 数 字 化 的 关键 是 编码 。50 年 来 ,图 像 编 码 技术 得 到 了 快速 的 发 展 ,已 经 有 多 种 成 熟 
的 编码 方法 得 到 了 广泛 应 用 ,特别 是 所 谓 的 第 一 代 编 码 更 是 如 此 。 而 且 , 随 着 多 媒体 技术 的 
发 展 ,已 有 若干 编码 标准 由 ITU-T 制定 出 来 ,如 JPEG、H. 261、H. 263、MPEG-1、MPEG-2、 
MPEG-4、MPEG-7、JBIG 等 。 数 据 压缩 编码 方法 经 过 几 十 年 的 发 展 ,针对 不 同 的 原始 数据 
的 特点 如 文本 声音、 图 像 . 视 频 、 动 画 已 研究 出 了 不 同 的 编码 方法 。 
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9.1.1 图 像 中 的 信息 宛 余 


虽然 数字 图 像 需 要 占用 大 量 的 存储 单元 ,但 图 像 数 据 是 高 度 相关 的 , 即 数字 图 像 信息 中 
存在 大 量 的 元 余 信息 。 车 能 去 掉 这 些 宛 余 信息 , 则 既 可 以 实现 对 图 像 数 据 的 有 效 压 缩 ,同时 
又 不 会 对 图 像 的 有 用 信息 造成 太 大 的 损失 。 数 字 图 像 的 信息 元 余 主 要 包括 视觉 元 余 、 空 间 
元 余 .时间 宛 余 ,信息 炉 元 余 、 结 构 宛 余 和 知识 宛 余 等 形式 。 

1. 视觉 元 余 

视觉 元 余 是 指 人 类 视觉 系统 不 敏感 或 不 能 感知 的 那 部 分 图 像 信 息 。 人 的 眼睛 对 图 像 细 
节 和 颜色 的 辨认 能 力 是 有 限 的 ,研究 表明 ,人 类 的 视觉 能 力 最 多 可 辨认 出 上 千 种 颜色 ,而 彩 
色 图 像 一 般 每 个 像素 用 24 位 表示 ,可 表示 出 2* 种 颜色 ,由 此 可 见 彩色 图 像 对 人 的 视觉 特性 
而 言 , 存 在 大 量 的 信息 宛 余 , 称 为 视觉 元 余 。 

2. 空间 宛 余 

图 像 内 部 相 邻 像素 之 间 存 在 较 强 的 相关 性 所 产生 的 图 像 信息 宙 余 称 为 时 间 宛 余 。 图 像 
中 的 大 部 分 物体 的 表面 颜色 都 是 均匀 的 、 连 续 的 ,图 像 内 部 相 邻 像素 之 间 存 在 较 强 的 相关 
性 。 因 此 图 像 数 字 化 为 像素 点 的 MX N 矩阵 以 后 ,矩阵 中 的 大 量 相 邻 数 据 是 十 分 接近 或 完 
全 一 样 ,这 就 是 图 像 信息 的 空间 元 余 。 

3. 时 间 宛 余 

对 于 以 电视 .电影 等 为 代表 的 视频 图 像 ,视频 图 像 信号 播放 过 程 中 图 像 序列 的 不 同 帧 之 
间 存 在 大 量 的 相关 性 ,由 此 产生 的 信息 宛 余 称 为 时 间 元 余 。 

4. 信息 蚁 宛 余 

信息 炉 宙 余 又 称 为 编码 元 余 , 如 果 图 像 中 平均 每 个 像素 使 用 的 比特 数 大 于 该 图 像 的 信 
息 炉 甩 , 则 图 像 中 存在 信息 元 余 , 这 类 页 余 称 为 信息 粹 元 余 。 

5. 结构 宛 余 

在 许多 图 像 中 ,图 像 中 可 能 存在 很 强 的 纹理 结构 或 自 相 似 形 .或 图 像 全 局 或 不 同 部 分 之 
间 存 在 很 强 的 纹理 结构 或 自 相似 性 ,由 此 产生 的 图 像 信 息 宛 余 称 为 结构 宙 余 。 

6. 知识 宛 余 

在 某 些 图 像 中 还 包含 与 某 些 先 验 知识 有 关 的 信息 ,由 此 产生 的 图 像 信 息 宛 余 称 为 知识 元 余 。 
图 像 数据 中 存在 的 完 余 信息 为 图 像 压 缩编 码 提供 了 依据 。 图 像 编 码 的 目的 就 是 尽 可 能 
去 除 图 像 数 据 中 存在 的 各 种 完 余 信息 ,特别 是 空间 宛 余 、 视 觉 宛 余 及 时 间 完 余 , 以 尽 可 能 少 
的 比特 编码 表示 一 幅 图 像 数 据 。 例 如 ,由 于 人 眼 的 视觉 特性 对 蓝光 不 敏感 ,因此 ,彩色 图 像 
编码 时 ,就 可 以 用 较 低 的 精度 对 蓝 色 分 量 进行 编码 。 利 用 各 种 元 余 信息 ,压缩 编码 技术 能 够 
很 好 地 解决 将 模拟 信号 转换 为 数字 信和 号 后 所 产生 的 带宽 需求 增加 的 问题 , 它 是 使 数字 信号 
走 上 实用 化 的 关键 技术 之 一 。 表 9-1 列 出 了 几 种 常见 应 用 的 码 率 。 

表 9-1 常用 电视 信号 的 码 率 


应 用 种 类 | bit/ 像 素 | 像素 数 / 行 | 行 数 / 帧 | 帧 数 /s 亮色 压缩 前 压缩 后 
电视 电话 8 128 112 30 4:1:1 | 5.2Mb/s 56Kb/s 
会 议 电 视 8 352 288 30 4:1:1 |36.5Mb/s | 1.5~2.0Mb/s 
普通 电视 8 720 480 30 4:1:1 | 167Mb/s | 4.0~9.0Mb/s 
高 清 电 视 8 1920 1080 30 4:1:1 | 1.18Gb/s |20.0~25.0Mb/s 
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9.1.2 图 像 编码 分 类 


图 像 编 码 是 指 按照 一 定 的 格式 存储 图 像 数据 的 过 程 , 而 编码 技术 则 是 研究 如 何在 满足 
一 定 的 图 像 保 真 条 件 下 ,压缩 表示 原始 图 像 数 据 的 编码 方法 。 图 像 编码 技术 不 仅仅 是 应 
线性 脉冲 编码 调制 法 (线性 PCM) ,更 主要 的 是 利用 图 像 信号 的 统计 特性 以 及 视觉 对 图 像 的 
生理 学 和 心理 学 特性 对 图 像 进 行 信 源 编 码 。 目 前 有 很 多 流行 的 图 像 格式 标准 ,如 BMP、 
PCX、TIFF、GIF、JPEG 等 ,它们 都 是 采用 了 不 同 的 编码 方法 。 

在 信息 论 中 ,一 个 典型 的 数字 通信 模型 如 图 9-1 所 示 。 其 中 ,信道 编码 的 主要 任务 是 解 
决 信息 传输 的 可 靠 性 问题 ,使 信号 在 传输 过 程 中 尽量 不 出 错 或 少 出 错 ,以 及 产生 错误 之 后 的 
错误 纠正 。 信 源 编码 的 主要 任务 是 解决 信息 表示 的 有 效 性 问题 , 即 尽 量 提高 编码 效率 ,以 最 
少 的 数码 表示 尽 可 能 多 的 信息 量 , 对 信 源 实现 压缩 处 理 。 图 像 编码 的 目的 是 要 研究 压缩 数 
码 率 , 即 高 效 编码 问题 。 


[Linm 
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图 9-1 典型 通信 系统 模型 


图 像 编 码 属 于 信 源 编码 的 范畴 ,从 不 同 的 角度 看 问题 就 会 有 不 同 的 分 类 方法 ,并 没有 统 
一 的 标准 。 根 据 图 像 的 信号 形式 可 分 为 模拟 图 像 编 码 和 数字 图 像 编 码 ; 按 图 像 光 谱 特征 可 
分 为 单 色 图 像 .彩色 图 像 和 多 光谱 图 像 编 码 ; 从 信号 处 理 维 数 出 发 可 以 分 为 行内 编码 、 帧 内 
编码 和 帧 间 编 码 ; 从 灰 度 概念 出 发 可 以 分 为 二 值 图 像 和 多 灰 度 图 像 编 码 。 此 外 ,Kunt 将 以 
消除 宛 余 为 基础 的 编码 方法 称 为 第 一 代 编 码 ,包括 PCM、DPCM、 亚 取样 编码 法 ,基于 变换 
域 的 DFT .DCT、Walsh-Hadamard 等 编码 方法 以 及 混合 编码 法 均 属于 经 典 的 第 一 代 编码 
法 。 而 第 二 代 编 码 方法 主要 指 Fractal 编码 ,金字 塔 编码 法 、 小 波 变换 编码 法 、 基 于 神经 元 网 
络 的 编码 方法 、 模 型 基 编码 法 等 新 的 编码 方法 。 由 此 可 以 看 出 ,不 仅 图 像 编 码 的 方案 是 多 种 
多 样 的 ,编码 的 分 类 也 不 是 绝对 的 。 

根据 压缩 原理 进行 划分 ,可 以 分 为 四 大 类 ,如 表 9-2 所 示 , 这 些 方法 既 适 用 于 静止 图 像 
编码 ,也 适用 于 视频 图 像 信号 编码 。 
表 9-2 图 像 编码 方法 分 类 


算法 分 类 编码 方法 举例 主要 特点 
霍 夫 曼 编 码 
粹 编码 算术 编码 
RLE 编码 


炉 编 码 又 称 为 统计 编码 ,建立 在 图 像 统计 特征 基础 
之 上 的 数据 压缩 方法 
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续 表 
算法 分 类 编码 方法 举例 主要 特点 
i DPCM 编码 依据 菜 一 模型 ,根据 以 往 的 样本 信 对 于 新 样本 值 进 
运动 补偿 法 行 预测 编码 
DCT 变换 编码 将 空域 中 描述 的 图 像 数 据 经 过 变换 ,转换 到 变换 域 
变换 编码 DFT 变换 编码 中 进行 描述 ,达到 改变 能 量 分 布 的 目的 ,实现 对 信 源 
小 波 变换 编码 图 像 数 据 的 有 效 压 缩 
JPEG 编码 i 
混合 编码 MPEG 编码 主要 包括 静止 图 像 和 运动 图 像 的 压缩 标准 系列 


根据 解码 后 的 图 像 数 据 与 原始 图 像 数 据 是 否 完全 一 致 ,可 分 为 有 损 编 码 与 无 损 编码 。 
有 损 编码 是 指 对 图 像 进行 解压 后 重新 构造 的 图 像 与 原始 图 像 存在 着 一 定 的 误差 。 有 损 压 缩 
利用 了 图 像 信 息 本 身 包含 的 许多 宛 余 信息 ,如 视觉 元 余 和 空间 宛 余 。 由 于 有 损 压缩 一 般 情 
况 下 可 获得 较 好 的 压缩 比 , 因 此 在 对 图 像 的 质量 要 求 不 苛刻 的 情况 下 一 般 应 选择 有 损 压 缩 。 

无 损 编 码 是 指 对 图 像 数据 进行 解压 后 重新 构造 出 来 的 图 像 与 原始 图 像 之 间 完全 相同 。 
行程 长 度 编码 就 是 无 损 编 码 的 一 个 实例 ,其 编码 原理 是 在 给 定 的 数据 中 寻找 连续 重复 的 数 
值 , 然 后 用 两 个 数值 (重复 数值 的 个 数 ,重复 数值 本 身 ) 代 蔡 这 些 连 续 的 数值 ,以 达到 数据 压 
缩 的 目的 。 运 用 此 方法 处 理 拥 有 大 面积 色调 一 致 的 图 像 时 ,可 达到 很 好 的 数据 压缩 效果 。 

需要 指出 的 是 ,为 了 实现 更 高 的 编码 效率 ,各 种 具体 编码 方法 并 不 一 定 是 孤立 .单一 地 
使 用 ,往往 需要 各 种 方法 的 交叉 使 用 。 


9.1.3 图 像 编码 新 方法 


图 像 编 码 新 方法 主要 是 指 Kunt 提出 的 第 二 代 编 码 方法 ,包括 分 形 编码 (fractal 
coding) ,小 波 变换 编码 (wavelet coding)、 模 型 压缩 编码 (model based coding)、 人 工 神经 网 
络 (artificial neural network) 编 码 和 基于 对 象 的 压缩 编码 (object based coding) 等 。 

1) 分 形 编码 

分 形 编码 是 基于 美 籍 波 兰 数学 家 B. B. Mandelbrot 建立 的 分 形 几 何 理论 而 发 展 起 来 的 
一 种 新 的 编码 方法 , 它 主 要 适用 于 自 相似 性 较 高 的 图 像 。 分 形 编码 最 大 限度 地 利用 了 图 像 
在 空间 域 上 的 自 相似 性 , 即 图 像 局 部 与 整体 之 间 存 在 的 某 种 相似 性 ,通过 消除 图 像 的 几何 元 
余 来 压缩 数据 。M. Barnsley 将 迭代 函数 系统 (IFS) 用 于 描述 图 像 的 自 相 似 性 ,并 用 于 图 像 
编码 ,对 某 些 特定 图 像 获 得 了 高 达 10 000 : 1 的 压缩 比 。 相 比较 而 言 , 分 形 编码 过 程 非常 复 
杂 , 但 解码 过 程 较 简单 。 因 此 ,该 方法 通常 用 于 只 需 对 图 像 进行 一 次 编码 ,但 需 多 次 译 码 的 
信息 传播 系统 中 。 

2) 小 波 变 换 编码 

小 波 变换 编码 于 1989 年 由 S. G. Mallat 首次 使 用 ,由 于 小 波 变 换 在 时 频 两 域 同时 具有 
良好 的 特性 ,因此 经 过 小 波 变换 后 的 图 像 具 有 很 好 的 空间 方向 选择 性 ,而 且 保持 了 小 波 的 多 
分 辩 率 特性 ,能够 保持 原 图 像 在 各 种 分 辩 率 下 的 精细 结构 ,与 人 的 视觉 特性 非常 吻合 。 

3) 模型 压缩 编码 

模型 压缩 编码 的 基本 原理 是 在 编码 、 解 码 两 端 分 别 建立 相同 的 模型 ,编码 时 利用 先 验 模 
型 抽取 图 像 中 的 主要 特征 信息 并 以 模型 参数 的 形式 表示 ,解码 时 则 根据 所 接收 的 模型 参数 
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重建 图 像 。 模 型 压缩 编码 又 称 为 模型 编码 , 它 是 近 几 年 发 展 起 来 的 一 种 很 有 前 途 的 低 比 特 
率 编码 新 方法 。 

新 编码 方法 一 般 具 有 以 下 特点 : 

(1) 充分 考虑 人 的 视觉 特性 。 

(2) 合理 地 考虑 对 图 像 信号 的 分 解 与 表述 。 

(3) 采用 图 像 的 合成 与 识别 方法 提高 数据 压缩 率 。 


9.2 图 像 编 码 评价 


50 年 来 ,图 像 编码 的 新 方法 不 断 涌现 , 随 着 众多 图 像 压 缩 算法 的 出 现 以 及 图 像 处 理 技 
术 在 各 行 各 业 的 广泛 应 用 ,图 像 压缩 算法 的 评价 开始 受到 广泛 关注 。 一 般 情况 下 ,图 像 压缩 
算法 的 评价 主要 包括 编码 图 像 的 质量 、 图 像 编 码 效 率 、 复 杂 度 与 适用 范围 等 方面 。 


9.2.1 编码 图 像 的 质量 


图 像 质 量 评价 可 分 为 客观 评价 和 主观 评价 。 客 观 评 价 指标 主要 是 均 方 误差 (MSE) 和 
峰值 信 品 比 (PSNR) ,其 定义 分 别 为 


M-1 N-1 


me 1 NY ge ni 加 
MSE 一 页 XN 名 名 [fG7) — f0,7)] -3 
PSNR = 10le (SE | (9-2) 


客观 评价 特点 是 指标 具有 客观 性 ,可 快速 有 效 地 评价 编码 图 像 的 质量 ,但 符合 客观 评价 
指标 的 图 像 不 一 定 具有 较 好 的 主观 质量 。 图 像 质量 的 好 坏 , 既 与 图 像 本 身 的 客观 质量 有 关 ， 
也 与 人 的 视觉 系统 的 感受 特性 有 关 。 有 时 客观 保 真 度 指标 完全 相同 的 两 幅 图 像 可 能 会 有 完 
全 不 相同 的 视觉 效果 ,因此 ,对 于 图 像 质 量 的 评价 还 需 采 用 主观 保 真 度 准则 。 主 观 评价 是 指 
由 一 批 观察 者 对 编码 图 像 进行 评价 计 分 ,然后 依据 全 部 评价 人 员 的 评判 信息 ,给 出 图 像 的 质 
量 评价 。 主 观 评价 的 特点 是 与 人 的 视觉 效果 相 匹 配 ,但 其 评判 过 程 缓慢 费时 。 


9.2.2 效率 指标 


图 像 编 码 算法 的 效率 主要 表现 为 平均 码 字 长 度 (R)、 图 像 的 压缩 比 (x)、 每 秒 传输 比特 
数 (bps) 、 图 像 编码 效率 (7) ,这 些 表现 形式 很 容易 相互 转换 。 

1. 图 像 的 信息 蚁 

设 一 幅 灰 度 级 为 K 的 图 像 , 图 像 中 第 & 级 灰 度 出 现 的 概率 为 p ,图 像 大 小 为 MXN ,每 
个 像素 用 a 比特 表示 ,每 两 帧 图 像 间隔 At, 则 按 信息 论 中 信息 炉 的 定义 ,数字 图 像 的 粹 及 
由 下 式 定义 


K 
H =— 2 pr logz ps (9-3) 
根据 上 述 定义 可 知 ,信息 灶 互 表示 各 灰 度 级 比特 数 的 统计 平均 值 。 
2. 图 像 的 平均 码 字 长 度 
图 像 的 平均 码 字 长 度 尺 为 
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K 
R= 2)Bips (9-4) 
式 中 ,Bi 表示 某 种 图 像 编码 方法 的 第 & 级 灰 度 的 码 字 长 度 。 
3. 图 像 的 编码 效率 
编码 效率 了 定义 为 
7 二 是 X100% 的- 
4. 图 像 的 信息 宛 余 度 
信息 元 余 度 为 
DV 二 1 一 六 (9-6) 
5. 每 秒 钟 所 需 的 传输 比特 数 
每 秒 钟 所 需 的 传输 比特 数 bps 为 
_ MXNXR 
bps = 1 《人 = 人 
6. 压缩 比 
压缩 比 > 为 
_ 二 
ee (9-8) 


一 般 情 况 下 ,同一 压缩 算法 对 不 同 图 像 的 编码 效率 并 不 一 定 相同 。 
9.2.3 复杂 度 与 适用 范围 


图 像 编码 算法 的 复杂 上 度 指 完成 图 像 压 缩 和 解压 所 需 的 运算 量 以 及 实现 该 算法 的 硬件 复 
杂 度 。 一 个 好 的 压缩 算法 一 般 应 具有 高 压缩 比 、 算 法 简单 .压缩 和 解 缩 过程 快 、 易 于 硬件 实 
现 、 解 压 后 图 像 质量 好 等 特点 。 

几乎 所 有 的 图 像 编码 算法 都 具有 自身 的 适用 范围 ,并 非 对 所 有 图 像 都 具有 高 效 和 高 质 
量 特性 。 一 般 来 说 ,大 多 数 基 于 图 像 信息 统计 特性 的 压缩 算法 具有 较 广 的 适用 范围 ,而 一 些 
特定 的 编码 算法 的 适用 范围 较 罕 ,如 分 形 编码 主要 用 于 自 相 似 性 高 的 图 像 。 


9.3 图 像 统 计 编 码 


统计 编码 又 称 为 烂 编码 , 它 是 建立 在 图 像 统 计 特征 基础 之 上 的 数据 压缩 方法 ,根据 香农 
的 观点 ,信息 宛 余 来 自信 源 数 据 本 身 的 相关 性 和 信 源 内 事件 的 概率 分 布 不 均匀 性 ,只 要 找到 
去 除 相 关 性 和 改变 概率 分 布 不 均匀 的 方法 ,也 就 找到 了 信 源 数据 的 统计 编码 方法 。 


9.3.1 变 长 最 佳 编码 定理 


在 变 长 编码 中 ,对 出 现 概率 大 的 符号 编 以 短 码 字 ,对 出 现 概率 小 的 符号 编 以 长 码 字 。 如 
果 码 字 长 度 严 格 按照 对 应 符号 出 现 的 概率 大 小 逆序 排列 , 则 其 平均 码 字 长 度 为 最 小 ,这 就 是 
变 长 最 佳 编码 定理 。 这 是 一 种 最 佳 编码 定理 , 变 长 最 佳 编码 定理 是 霍 夫 曼 编码 的 理论 基础 。 
根据 信 源 编码 理论 , 当 平均 码 字 长 度 R 大 于 或 等 于 图 像 粹 时 ,总 可 设计 出 一 种 无 失 
真 编码 方法 。 当 平均 码 字 长 度 远大 于 图 像 粹 时 ,表明 该 编码 方法 效率 很 低 ; 当 平均 码 字 长 
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度 等 于 或 按 大 于 方向 很 接近 于 图 像 炉 时 , 称 此 编码 方法 为 最 佳 编码 ,此 时 不 会 引起 图 像 失 
真 ; 当 平均 码 字 长 度 小 于 图 像 丧 五 时 ,压缩 比较 高 ,但 会 引起 图 像 失真 。 

设 变 长 编码 所 用 的 码 元 进 制 为 D, 第 i 个 符号 出 现 的 概率 为 p;, 与 其 对 应 的 码 子 长 度 为 
Ni;, 则 变 长 最 佳 编码 的 平均 码 字 长 度 RR 的 范围 为 


Dt+1>R>E (9-9) 
而 对 于 出 现 概率 为 p; 的 信 源 符号 ,其 码 字 长 度 存 在 如 下 关系 : 
一 logobpi; 十 1 Ni > 一 logop， (9-10) 
因此 ,对 于 常用 的 二 进 制 则 有 
一 log:zi 十 1 之 Ni >— log:p; 


由 此 可 见 , 信 源 符号 的 码 字 长 度 是 由 信 源 符号 自身 出 现 的 概率 决定 的 。 
9.3.2 霍 夫 曼 编 码 


霍 夫 曼 (Huffman) 编 码 是 霍 夫 曼 于 1952 年 提出 的 一 种 无 损 编码 方法 ,该 方法 完全 依据 
信 源 字符 出 现 的 概率 来 构造 其 码 字 ,对 出 现 概率 大 的 字符 使 用 较 短 的 码 字 ,而 对 出 现 概 率 低 
的 字符 使 用 较 长 的 码 字 ,从 而 达到 压缩 数据 的 目的 。 霍 夫 曼 编码 有 时 又 称 为 最 佳 编码 (一 般 
直接 叫 霍 夫 曼 编码 ) ,最 初 主要 用 于 文本 文件 压缩 。 霍 夫 曼 编码 是 一 种 变 长 编码 (VLC), 同 
时 也 是 一 种 无 失真 编码 ,属于 焙 编 码 范畴 。 在 具有 相同 信 源 概率 分 布 的 前 提 下 , 它 的 平均 码 
字 长 度 比 其 他 任何 一 种 编码 方法 都 短 。 

1. 霍 夫 曼 编码 算法 

霍 夫 曼 编码 是 以 信 源 字符 的 概率 分 布 为 基础 的 , 若 理论 上 并 不 知道 信 源 字符 的 概率 分 
布 , 可 以 根据 对 大 量 数据 进行 统计 所 得 到 的 统计 分 布 来 近似 代替 。 以 统计 数据 代替 实际 概 
率 分 布 , 可 能 会 导致 实际 应 用 时 霍 夫 曼 编码 无 法 达到 最 佳 编码 效能 ,应 用 中 可 以 根据 输入 数 
据 序 列 自 适应 地 匹配 信 源 概率 分 布 的 方法 ,这 样 就 能 一 定 程度 上 改进 霍 夫 曼 编码 的 性 能 。 

实现 霍 夫 曼 编码 的 基本 步骤 如 下 : 

(1) 统计 信 源 字符 序列 中 各 符号 出 现 的 概率 ,将 各 字符 出 现 的 概率 按 由 大 到 小 的 顺序 
排列 。 

(2) 将 最 小 的 两 个 概率 相 加 ,并 合并 成 新 的 概率 ,与 其 他 概率 重新 按 由 大 到 小 的 顺序 
排列 。 

(3) 重新 排列 后 将 两 个 最 小 概率 相 加 合并 为 新 的 概率 , 即 重复 步骤 (2) 直 到 最 后 两 个 概 
率 之 和 为 1.0。 

(4) 对 每 个 概率 相 加 的 组 合 中 ,概率 大 的 指定 为 0, 概 率 小 的 指定 为 1( 或 者 概率 大 的 指 
定 为 1, 小 的 指定 为 0) , 若 两 者 相等 , 则 可 以 指定 任意 一 个 为 0, 而 另 一 个 为 1 。 

(5) 找 出 由 每 一 个 信 源 字符 到 达 概 率 为 1.0 处 的 路 径 ,顺序 记录 沿路 径 的 每 一 个 1 和 0 
的 数字 编码 。 

(6) 反 向 写 出 编码 , 即 为 该 信 源 字符 的 霍 夫 曼 编码 。 

2. 霍 夫 曼 编码 实例 

下 面 通过 一 个 例子 来 详细 说 明 霍 夫 曼 编码 的 具体 过 程 。 

例 9-1: 霍 夫 曼 编码 实例 
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设 一 幅 灰 度 级 为 8 的 图 像 中 ,各 灰 度 级 分 别 用 S。、Si 、S。、S;、S,、S; 、Ss 、S; 表示 ,对 应 的 
概率 分 别 为 0. 40.0. 18 .0. 10.0. 10.0. 07.0. 06 .0.05.0. 04。 现 对 其 进行 霍 夫 曼 编码 。 

编码 过 程 如 图 9-2 所 示 , 具 体 步 骤 如 下 : 

(1) 对 信 源 概率 由 大 到 小 排序 ,排列 为 0. 40、0. 18、0. 10、0. 10 .0. 07、.0. 06 .0. 05、.0. 04。 

(2) 选 出 两 个 最 小 的 概率 0.04 和 0. 05, 相 加 得 0. 09 ,与 其 他 概率 重新 排序 0. 40、0. 18、 
0. 10.0. 10.0.09.0.07.0.06。 

(3) 对 重新 排序 的 概率 选 出 两 个 最 小 的 概率 0. 06 和 0. 07, 相 加 得 0. 13 ,组 成 新 的 概率 
序列 0. 40、0. 18、0. 10、0. 10 .0.09 .0. 13。 
(4) 对 重新 排序 的 概率 选 出 两 个 最 小 的 概率 0.09 和 0. 10, 相 加 得 0. 19 ,组 成 新 的 概率 
序列 0. 40、0. 18.0. 13、0. 10 .0. 19 。 
(5) 对 重新 排序 的 概率 选 出 两 个 最 小 的 概率 0. 10 和 0. 13 , 相 加 得 0. 23 ,组 成 新 的 概率 
序列 0. 40、0. 19、0. 18、0. 23 。 
(6) 对 重新 排序 的 概率 选 出 最 小 的 两 个 概率 0. 18 和 0.19, 相 加 得 0. 37, 组 成 新 的 概率 
序列 0. 40、0. 23、0. 37。 
(7) 对 重新 排序 的 概率 选 出 最 小 的 两 个 概率 0.23 和 0. 37, 相 加 得 0. 60, 组 成 新 的 概率 
序列 0. 40 .0. 60。 

(8) 已 形成 只 有 最 后 两 个 概率 0. 40 和 0. 60, 相 加 之 和 为 1. 0。 

(9) 写 出 路 径 编码 。 根 据 以 上 步骤 可 以 得 出 如 图 9-2 所 示 编 码 图 形 。 按 编码 一 般 步 
又 ,从 第 一 个 符号 开始 或 者 从 最 后 一 个 符号 开始 进行 路 径 的 0 或 1 数字 编码 。 若 从 最 后 一 
个 符号 开始 ,首先 给 最 后 相 加 的 两 个 概率 0. 40 和 0. 60 分 配 码 字 , 由 于 0. 60 大 于 0. 40 , 因 
此 概率 0. 60 的 路 径 为 0, 而 0. 40 的 路 径 1。 依 次 类 推 ,给 每 次 相 加 的 两 个 概率 的 路 径 分 配 
码 字 0 或 1, 最 后 得 到 如 图 9-2 所 示 的 编码 。 

(10) 形成 专 夫 曼 编码 。 以 对 应 概率 为 0. 18 的 字符 Si 为 例 ,在 从 0.18 到 1.0 的 路 径 
上 ,Si 沿路 径 编 码 依次 为 1.0.0, 反 向 写 出 编码 即 为 001, 因 此 ,字符 Si 的 霍 夫 曼 编 码 


为 001。 
信 源 符号 出 现 概率 哈 夫 最 编码 

50 0.40 1 100 1 

SI 018 1 037-0 0.600| 001 

S 010 0.23 dl 011 

53 0410 0 0.419 9 0000 

Si 0.07 一 37 0 0100 

Ss 006 一 0 ! 1 0101 

Ss 005 一 "0.09 00010 

马 “00 一 00011 


图 9-2 ”和 霍 夫 曼 编码 过 程 
上 述 霍 夫 曼 编码 方法 形成 的 码 字 是 可 识别 的 , 即 能 够 保证 一 个 符号 的 码 字 不 会 与 另 一 
个 符号 的 码 字 的 前 几 位 相同 。 
3. 霍 夫 曼 编 码 的 效率 
(1) 图 像 信息 炉 为 


N 
We== 2 ps logz px 
k=0 
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一 一 (0. 40 X logz0. 40 + 0.18 Xlog:0.18 十 2 X 0.10log:0.10 十 0.07X 
log:0. 07 十 0.06 X log:0.06 十 0.05 Xlog:0.05 十 0.04 X logs0.04 
王 沁 ; 症 
(2) 平均 码 字 长 度 为 


N 
R= PD Bips 
k=1 


1X0.40+3X0.18+3X0.10 二 4X0.10 二 4X0.07 十 4X0.06 十 5X 
0.05 十 5 XxX 0.04 二 2.61 
(3) 效率 为 


(4) 信息 完 余 度 为 
v=1—7= 2.2% 

根据 例 9-1 的 计算 结果 ,可 得 如 表 9-3 所 示 的 霍 夫 曼 编码 效能 表 。 
表 9-3 霍 夫 曼 编码 结果 


信 源 符号 出 现 概率 霍 夫 曼 码 字 码 字 长 度 
So 0.40 1 1 
Si 0.18 001 3 
Ss: 0.10 011 3 
S$ 0.10 0000 4 
S, 0.07 0010 4 
Ss 0.06 0101 4 
Ss 0.05 00010 5 
S， 0.04 00011 5 
信息 箭 H=2.55 
编码 效能 平均 码 长 R=2. 61 
编码 效率 7=97.8% 


若 8 个 灰 度 级 按 如 表 9-4 所 示 第 2 列 的 概率 出 现 , 即 分 别 以 2 的 负 宕 次 方 且 非 均匀 分 


布 的 概率 出 现 , 则 其 霍 夫 曼 编码 效果 如 表 9-4 所 示 。 


表 9-4 非 均 匀 概 率 分 布 霍 夫 曼 编码 效能 


信 源 符号 出 现 概率 和 霍 夫 曼 码 字 码 字 长 度 
So 六 1 1 
Si 2 01 2 
Se Cg 001 3 
Ss 0001 4 
Ss Pa 00001 5 
Ss 2 000001 6 
Ss 2 0000001 7 
S 了 0000000 7 
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续 表 
信 源 符号 出 现 概率 霍 夫 曼 码 字 码 字 长 度 
信息 炉 H=1. 984 375 
编码 效能 平均 码 长 R=1. 984 375 
编码 效率 7=100% 


4. 霍 夫 曼 编码 的 特点 

霍 夫 曼 编码 具有 以 下 特点 : 

(1) 当 图 像 藉 度 值 分 布 很 不 均匀 时 , 霍 夫 曼 编码 效率 比较 高 。 以 例 9-1 为 例 , 编 码 效率 
为 97. 8%% ,其 宛 余 度 只 有 2.2%, 若 采用 等 长 编码 ,由 于 灰 度 级 为 8, 根 据 信息 论 每 种 灰 度 级 
别 至 少 需 要 3bit 来 表示 , 则 平均 码 长 为 3, 编 码 效率 为 85%。 当 信 源 概率 是 2 的 负 宕 次 方 
时 ,编码 效率 为 100%。 而 在 图 像 灰 度 值 的 概率 分 布 比较 均匀 时 ,和 霍 夫 曼 编码 的 效率 就 低 。 

(2) 对 不 同 概率 分 布 的 信 源 , 霍 夫 曼 编码 的 编码 效率 各 不 相同 。 对 于 二 进 制 编码 体系 ， 
当 信 源 概率 为 2 的 负 宕 次 方 时 ,和 翟 夫 曼 编码 的 编码 效率 可 达 100% ,其 平均 码 字 长 度 也 很 
短 , 而 当 信 源 概率 为 均匀 分 布 时 ,其 编码 效果 明显 降低 。 即 便 是 如 表 9-5 所 示 ,服从 2 的 负 
和 次 方 的 均匀 分 布 信息 源 ,由 于 字符 概率 均匀 分 布 ,其 炉 最 大 ,平均 编码 长 度 很 大 (编码 过 程 
如 图 9-3 所 示 ) ,因此 从 压缩 比 r 等 其 他 指标 看 ,其 编码 效率 较 低 。 也 就 是 说 ,在 信 源 概率 接 
近 于 均匀 分 布 时 ,一 般 不 使 用 截 夫 曼 编码 。 

(3) 霍 夫 曼 编码 方法 产生 的 编码 不 是 唯一 的 。 编 码 过 程 中 在 给 两 个 最 小 概率 的 灰 度 值 
进行 编码 时 , 既 可 以 是 大 概率 为 0, 小 概率 为 1, 也 可 以 是 大 概率 为 1 ,小 概率 为 0。 另外 , 当 
两 个 灰 度 值 出 现 的 概率 相等 时 ,0 和 1 的 分 配 也 是 随机 的 ,因此 编码 不 具 唯 一 性 。 

(4) 霍 夫 曼 编码 需 建 立 在 已 知 图 像 数据 信息 的 概率 分 布 特性 的 基础 上 , 才 可 以 实现 图 
像 数 据 编 码 。 若 信 源 符号 很 多 ,那么 码 表 就 会 很 大 ,这 必 将 影响 到 存储 、 编 码 与 传输 。 因 此 ， 
有 些 观 点 认为 瞪 夫 曼 编码 缺乏 构造 性 。 

(5) 霍 夫 曼 编 码 方法 对 图 像 数 据 进行 编码 时 , 需 两 次 读 取 图 像 数 据 。 第 一 次 是 为 了 计 
算 每 个 数据 出 现 的 概率 ,并 对 各 数据 出 现 的 概率 进行 排序 ,在 排序 过 程 中 获得 各 数据 的 编码 
值 。 第 二 次 读 取 数据 是 以 转换 表格 中 的 编码 值 代 蔡 图 像 数 据 存 人 图 像 编码 文件 中 。 

表 9-5 均匀 概率 分 布 霍 夫 曼 编 码 效 能 


信 源 符号 出 现 概率 堆 夫 曼 码 字 码 字 长 度 

Su Fs 1 3 

Si a 110 3 

Ss 101 3 

S; -i 100 3 

S， EE 011 3 

Ss 区 010 3 

Se 001 3 

S7 时 000 3 
信息 炉 H=3 
编码 效能 平均 码 长 R=3 

编码 效率 7=100% 


到 
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信 源 符号 出 现 概率 i i 哈 夫 曼 编 码 
So 125 i 100 111 
S 125 i 了 110 
5 125 101 
S125 9 i i 100 
S 125 站 011 
Ss 125 1 0 010 
Se 125 6 001 
5 125 000 


图 9-3 ”等 概率 分 布 堆 夫 曼 编 码 过 程 


9.3.3 香农 - 范 诺 编码 


香农 一 范 诺 (Shannon-Fannon) 编 码 也 是 一 种 典型 的 可 变 字 长 编码 。 与 霍 夫 曼 编码 相 
似 , 当 信 源 符号 出 现 的 概率 正好 为 2 的 负 寡 次 方 时 ,香农 一 范 诺 编码 的 编码 效率 可 以 达 
到 100%。 

1. 编码 步骤 

香农 一 范 诺 编码 的 理论 基础 是 符号 的 码 字 长 度 Ni 完全 由 该 符号 出 现 的 概率 来 决定 ， 
对 于 二 进 制 编码 即 有 

— log:pi 十 1 之 Ni >— log,p; (9-11) 

香农 一 范 诺 编码 的 实现 步骤 如 下 : 

(1) 将 信 源 符号 按 其 出 现 的 概率 由 大 到 小 顺序 排列 , 若 两 个 符号 的 概率 相等 , 则 相等 概 
率 的 字符 顺序 可 以 任意 排列 。 

(2) 根据 式 (9-11) 计 算出 各 概率 符号 所 对 应 的 码 字 长 度 N;。 

(3) 将 各 符号 的 概率 累加 ,计算 累加 概率 已 , 即 


Pu 一 0 
P=po 
P,= potp 


(9-12) 
Ps = potpitp: 


P;= po 二 Pi 二 pi 二 + 二 +pi = Pi pi 

(4) 把 各 个 累加 概率 P 由 十 进 制 转换 为 二 进 制 。 

(5) 根据 式 (9-11) 取 二 进 制 累加 概率 前 N; 位 的 数字 ,并 省 去 小 数 点 前 的 “0. "字符 , 即 
为 对 应 信 源 符号 的 香农 一 范 诺 编 码 码 字 。 

2. 编码 举例 

例 9-2: 香农 一 范 诺 编码 示例 

为 便于 与 霍 夫 曼 编码 方法 进行 比较 ,本 例 仍 以 例 9-1 的 图 像 数 据 进行 香农 一 范 诺 编 码 。 
编码 步骤 如 下 : 

(1) 将 信 源 符号 按 其 出 现 概率 由 大 到 小 顺序 排列 ,为 0. 40、0. 18、0. 10、0. 10、0. 07、 
0.06、0.05、0.04。 

(2) 对 于 概率 0. 40 对 应 的 符号 So ,根据 式 (9-11) 计 算 No 一 2, 将 累加 概率 0. 00 转换 位 
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二 进 制 小 数 为 0. 00, 取 前 N。 二 2 位 ,并 去 除 小 数 点 前 的 字符 , 即 S。 字符 编码 为 00。 
(3) 对 于 概率 0. 18 对 应 的 符号 Si ,根据 式 (9-11) 计 算 Ni 一 3, 将 累加 概率 0. 40 转换 位 
二 进 制 小 数 为 0.0110, 取 前 Ni=3 位 ,并 去 除 小 数 点 前 的 字符 , 即 S: 字 符 编 码 为 011。 
(4) 对 于 概率 0. 10 对 应 的 符号 S; ,根据 式 (9-11) 计 算 N: 一 4, 将 累加 概率 0. 58 转换 位 
二 进 制 小 数 为 0.10010, 取 前 N:=4 位 ,并 去 除 小 数 点 前 的 字符 , 即 Ss 字符 编码 为 1001 。 
(5) 对 于 概率 0. 10 对 应 的 符号 S; ,根据 式 (9-11) 计 算 Na 一 4, 将 累加 概率 0. 68 转换 位 
二 进 制 小 数 为 0. 10100, 取 前 Na =4 位 ,并 去 除 小 数 点 前 的 字符 , 即 S, 字符 编码 为 1010。 
(6) 对 于 概率 0. 07 对 应 的 符号 S, ,根据 式 (9-11) 计 算 Ns 二 4, 将 累加 概率 0.78 转换 位 
二 进 制 小 数 为 0.11000, 取 前 N, 二 4 位 ,并 去 除 小 数 点 前 的 字符 , 即 S, 字符 编码 为 1100。 

(7) 对 于 概率 0. 06 对 应 的 符号 S; ,根据 式 (9-11) 计 算 N; = 二 5, 将 累加 概率 0. 85 转换 位 二 
进 制 小 数 为 0.1101100, 取 前 Ni =5 位 ,并 去 除 小 数 点 前 的 字符 , 即 S; 字符 编码 为 11011。 

(8) 对 于 概率 0. 05 对 应 的 符号 Si ,根据 式 (9-11) 计 算 Ns 二 5, 将 累加 概率 0. 91 转换 位 二 
进 制 小 数 为 0. 1110100, 取 前 N。 二 5 位 ,并 去 除 小 数 点 前 的 字符 , 即 Se 字符 编码 为 11101。 

(9) 对 于 概率 0. 04 对 应 的 符号 S; ,根据 式 (9-11) 计 算 N;=5, 将 累加 概率 0. 96 转换 位 二 
进 制 小 数 为 0. 11110100, 取 前 N; 二 5 位 ,并 去 除 小 数 点 前 的 字符 , 即 5S; 字符 编码 为 11110。 

3. 香农 一 范 诺 编码 效能 

(1) 图 像 信息 粮 为 


H 一 一 2 logz pr = 2.55 
(2) 平均 码 字 长 度 为 | 
R= Da 
二 2X0.40 十 3X0.18 十 4X0.10 十 4X0.10 二 4X0.07 十 5X0.06 十 


5X0.05 十 5X0.04 王 3.17 


(3) 效率 为 
1 一 荐 X100%% 一 生生 = 80.4% 
(4) 信息 元 余 度 为 
v= 1—7= 19.6% 
结果 如 表 9-6 所 示 。 


表 9-6 香农 一 范 诺 编码 效能 表 


信 源 符号 | 出 现 概率 | 码 字 长 度 | 累加 概率 | 转换 位 二 进 制 | 香农 一 范 诺 码 字 

So 0. 40 2 0 0.00 00 

Si 0.18 3 0.40 0.011 011 

S; 0.10 4 0.58 0. 1001 1001 
S; 0.10 4 0. 68 0. 10100 1010 
S 0.07 4 0.78 0.1100 1100 
Ss 0.06 5 0. 85 0. 11011 11011 
Se 0.05 5 0.91 0. 11101 11101 
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续 表 
信 源 符号 | 出 现 概率 | 码 字 长 度 | 累加 概率 | 转换 位 二 进 制 香农 一 范 诺 码 字 
S; 0.04 5 0.96 0.111101 11110 
信息 雯 H=2.55 
编码 效能 平均 码 长 R=3.17 
编码 效率 7=80.4% 


4. 香农 一 范 诺 编 码 的 特点 

香农 一 范 诺 编 码 具 有 以 下 特点 : 

(1) 与 霍 夫 曼 编码 一 样 ,香农 一 范 诺 编码 属于 炉 编 码 , 需 要 知道 各 信 源 字符 出 现 的 
概率 。 

(2) 香农 一 范 诺 编码 效率 比 霍 夫 曼 编码 效率 略 低 一 些 。 在 这 个 例子 中 最 后 所 得 到 的 平 
均码 长 大 于 3bit, 也 就 是 说 大 于 采用 等 长 编码 方法 所 需要 的 码 长 。 这 是 因为 这 里 所 给 的 码 
字 集 合 的 个 数 太 少 而 引起 的 ,在 一 般 情况 下 ,香农 编码 的 平均 码 长 还 是 比 均匀 编码 的 码 
长 短 。 

5. 香农 一 范 诺 编 码 的 对 分 实现 法 

香农 一 范 诺 编码 的 另 一 种 编码 方法 则 不 需要 根据 式 (9-11) 进 行 计算 ,直接 根据 各 符号 
出 现 的 概率 序列 进行 编码 , 称 为 香农 一 范 诺 编码 的 对 分 法 (二 分 法 ) 实 现 法 。 具 体 实现 步骤 
如 下 : 

(1) 根据 各 符号 出 现 的 概率 , 按 由 大 到 小 的 顺序 排列 ,如 表 9-7 所 示 。 

(2) 在 该 概率 序列 的 某 个 中 间 位 置 将 其 对 分 , 即 分 为 两 个 子 序列 。 对 分 的 原则 为 尽量 
使 两 个 子 序列 的 概率 之 和 近似 相等 ,给 上 面 的 子 序列 编码 为 1, 下 面 的 子 序列 编码 为 0( 编 码 
见 插 号 内 的 数字 ,也 可 以 反 过 来 ) 。 

(3) 重复 步骤 (2) ,直到 各 个 子 序列 都 被 对 分 到 只 有 一 个 元 素 为 止 。 

(4) 将 每 个 元 素 所 属 的 子 序列 值 从 左 到 右 依次 编码 , 即 为 各 符号 对 应 的 香农 一 范 诺 
编码 。 

(5) 根据 有 关公 式 计算 编码 效能 ,结果 如 表 9-7 下 面 3 行 所 示 。 

表 9-7 香农 一 范 诺 编码 效能 表 


信 源 符号 | 出 现 概率 对 分 编 码 
Su 0. 40 0.58 0.40(1) 11 
Si 0.18 (1) 0.18(0) 10 
S: 0.10 0.10(1) 011 
0.20(1) 
Ss 0.10 0.10(0) 010 
S, 0.07 0.42 0.07(1) 0011 
0.13(1) 
Ss 0.06 (0) 0.06(0) 0010 
0.21(0) 
Ss 0.05 0.05(1) 0001 
0.09(0) 
S; 0.04 0.04(0) 0000 
信息 炉 H=2.55 
编码 效果 | 平均 码 长 R=2. 64 
编码 效率 7=96. 59% 
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6. 对 分 法 的 特点 

对 分 法 具有 以 下 特点 : 

(1) 根据 表 9-7 所 示 结 果 , 香 农 一 范 诺 编码 的 对 分 实现 方法 的 编码 效率 较 之 第 一 种 实 
现 方法 略 高 ,但 比 霍 夫 曼 编码 略 低 。 

(2) 香农 一 范 诺 编码 的 字符 码 字 长 度 并 不 完全 遵守 式 (9-11) ,事实 上 ,香农 一 范 诺 对 分 
法 编码 也 没有 采用 式 (9-11) 进 行 计算 。 


9.3.4 行程 长 度 编码 


行程 长 度 编码 又 称 RLE 压缩 方法 ,RLE 是 英文 Run Length Encoding 的 缩写 ,RLE 编 
码 属于 焙 编 码 ,是 最 简单 的 图 像 压 缩 的 方法 之 一 , 曾 广 泛 地 应 用 于 各 种 图 像 格式 文件 的 数据 
压缩 处 理 。 

1. RLE 编码 的 原理 

RLE 编码 的 原理 比较 简单 , 即 在 被 压缩 文件 中 寻找 连续 重复 的 数值 ,以 重复 次 数 和 重 
复数 值 自身 两 个 值 取代 文件 中 的 连续 值 ,重复 次 数 称 为 行程 长 度 。 例 如 ,车 有 一 串 字 符 信息 
aaaaabbbbcccddeefffaa, 经 RLE 编码 处 理 可 表示 为 5a4b3c2d2e3f2a。 

RLE 编码 的 特点 简单 明了 ,一般 用 于 包含 大 量 重复 信息 的 数据 时 可 以 获得 很 好 的 压缩 
效率 。 但 对 于 连续 重复 次 数 较 少 的 数据 文件 , 则 难以 获得 较 好 的 压缩 比 ,甚至 可 能 产生 压缩 
后 的 编码 字 节 数 大 于 处 理 前 的 图 像 字 节 数 。 所 以 行程 长 度 编码 的 压缩 效率 与 图 像 数 据 的 重 
复 情况 密切 相关 。 

另外 ,由 于 利用 应 用 程序 实现 行程 长 度 编码 的 压缩 时 ,分 别 以 一 个 字 节 表示 重复 数据 自 
身 ,用 另 一 个 字 节 表示 数据 重复 次 数 ,以 这 两 个 字 节 代替 一 串 重 复出 现 的 数据 。 为 区 分 不 同 
数据 的 含义 ,通常 需要 在 表示 重复 次 数 的 字 节 的 前 一 位 或 二 位 作为 标志 位 ,提示 该 字 节 不 是 
数据 本 身 而 是 连续 重复 的 次 数 。 因 此 ,两 个 字 节 的 编码 最 多 只 能 代替 63 个 (2 一 1) 或 127 
个 (2 一 1) 字 节 长 度 的 重复 数据 。 如 果 超 出 了 所 能 表现 的 长 度 , 则 可 以 采取 增加 字 节 数 的 方 
式 予 以 解决 。 

不 同 格式 的 图 像 文件 ,如 BMP、PCX、TIFF 等 在 采用 行程 长 度 编码 压缩 图 像 数 据 时 的 
编码 方法 也 略 有 不 同 。RLE 编码 比较 适合 于 二 值 图 像 文 件 。 

2. ”PCX 文件 的 RLE 编码 方法 

PCX 格式 的 图 像 文件 是 采用 行程 压缩 方法 处 理 数据 的 。 压 缩编 码 原 理 是 : 在 256 色 的 
PCX 文件 中 ,每 个 像素 占 一 个 字 节 ,压缩 数据 以 字 节 为 单位 逐 行进 行 编码 ,每 行 填 充 到 偶数 
字 节 数 , 若 在 图 像 数 据 中 发 现 一 串 连 续 相同 的 数据 ,就 以 两 个 字 节 代替 这 串 连续 相同 的 数据 
存 和 图像 文件 中 。 这 两 个 字 节 中 的 第 一 个 字 节 表示 这 串 相 同 数据 的 重复 次 数 ,第 二 字 节 代 
表 重 复数 据 的 值 。 对 于 非 重复 数据 则 单独 处 理 。 另 外 第 一 字 节 的 前 两 位 作为 标志 位 置 为 
1, 即 0XC0 (11000000) ,其 余 6 位 所 表示 的 才 是 相同 数据 的 个 数 , 因 此 最 大 值 为 63。PCX 
格式 文件 编码 时 最 大 行程 长 度 为 63, 如 果 连 续 相同 的 数据 超过 63 个 , 则 必须 分 两 次 表示 。 

例 9-3: RLE 编码 方法 示例 

设 有 如 下 一 串 原始 图 像 数 据 , 以 PCX 格式 文件 进行 压缩 。 


0X18 0X18 0X18 … 0X18( 共 12 个 ) 0X5A 0X67 0X5F 0X71 0X69 0X28 … 0X28( 共 80 个 )0XD7 
0XD9 0XCC OXC8 
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根据 PCX 格式 的 图 像 文件 的 RLE 编码 原理 ,压缩 编码 如 下 : 


0XCC 0X18 OX5A OX67 OX5F OX71 0X69 OXFF 0X28 0XD1 0X28 
0XC1 0XD7 0XC1 0XD9 0XC1 0XCC 0XC1 0XC8 


需要 注意 的 是 ,对 于 大 于 或 等 于 0XC0(192) 的 数据 ,即使 不 重复 出 现 ,也 必须 以 两 个 字 
节 表 示 。 因 此 ,原始 数据 的 后 四 个 非 重复 数据 ,为 避免 解压 缩 数据 时 错误 地 将 0XD7 和 
0XD9 解压 为 连续 23 个 0XD9 ,对 每 一 个 大 于 0XC0 的 数据 采用 两 个 字 节 表示 。 

还 应 指出 的 是 ,尽管 现在 几乎 所 有 的 图 像 应 用 软件 都 支持 PCX 文件 格式 ,但 由 于 压缩 
比 不 高 ,目前 的 应 用 不 是 很 多 。 

3. ”RLE4 编码 方法 

用 于 BMP 文件 的 压缩 编码 方法 与 PCX 文件 编码 方法 略 有 不 同 ,以 16 色 位 图 数据 的 
RLE4 压缩 算法 为 例 ,RLE4 与 一 般 的 行程 编码 算法 相同 点 是 都 以 两 个 字 节 表示 图 像 数据 
中 一 串 重复 的 数据 。 其 中 第 1 字 节 表示 数据 重复 次 数 ,第 2 字 节 表示 重复 数据 自身 。 不 同 
点 是 RLE4 压缩 算法 在 第 1 字 节 中 所 表示 的 重复 数据 的 次 数 是 像素 重复 次 数 , 而 不 是 一 般 
RLE 编码 中 所 定义 的 字 节 重复 次 数 。 

例如 ,一 般 RLE 编码 中 的 数据 0X08 0X58 表示 将 图 像 数 据 0X58 连续 重复 显示 8 个 字 
季 , 但 在 RLE4 压缩 算法 中 , 则 表示 连续 显示 8 个 像素 。 另 外 ,RLE4 压缩 算法 与 一 般 RLE 
压缩 算法 不 同 点 还 表现 在 : 由 于 是 针对 16 色 图 像 数 据 ,如 表 9-8 所 示 , 引 进 了 4 组 特殊 的 识 
别 码 。 


表 9-8 RLE4 标识 字符 表 
标识 字符 注 “区 用 法 
RLE4 编码 的 一 个 压缩 单元 为 图 像 数据 的 一 
0X00 0X00 表示 该 行 图 像 数 据 已 经 结束 行 ,每 个 压缩 单元 结束 时 ,都 要 引入 该 识别 字 
符 进行 标记 
应 用 RLE4 算法 处 理 完 图 像 中 的 所 有 数据 
0X00 0X01 表示 整个 图 像 数 据 结束 时 ,都 要 引入 该 识别 字符 ,作为 图 像 数据 的 结 
束 标志 
转 义 字符 , 即 随后 的 两 个 字 节 分 | 常用 于 在 已 经 确定 的 背景 画面 上 的 某 个 区 域 
0X00 0X02 别 表示 下 一 个 像素 从 当前 位 置 | 内 增加 图 像 时 , 则 必须 在 这 组 数据 之 前 ,加 入 
开始 的 水 平 与 垂直 位 移 该 识别 字符 进行 标记 
在 该 标识 码 之 后 有 N/2 个 字 节 用 来 存放 这 
NN 个 不 同 的 数据 。 在 RLE4 压缩 算法 中 ,每 
个 字 节 包含 两 个 像素 的 颜色 值 , 当 连续 显示 
时 ,第 1 个 像素 按 字 节 高 4 位 表示 的 颜色 进 
行 显示 ,第 2 个 像素 则 按 字 节 的 低 4 位 显示 ， 
直至 依次 显示 完 该 标识 码 所 标识 的 N 个 像 
素 点 


OXOON(0) 表示 从 当前 位 置 起 ,图 像 数 据 存 
(03 达 NOXFF) | 在 连续 N 个 不 同 的 值 


由 表 9-8 可 知 ,每 组 标识 字符 都 由 两 个 字 节 组 成 ,第 1 字 节 值 均 为 0。BMP 文件 规定 压 
缩 数 据 的 字 节 数 必须 为 偶数 ,而 每 行 压缩 数据 的 字 节 数 则 必须 是 4 的 倍数 ,如 果 不 满足 该 条 
件 , 就 必须 用 0 补 齐 。 因 此 ,如 果 不 同 值 的 图 像 数 据 个 数 为 奇数 , 则 必须 在 这 些 图 像 数 据 的 
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尾部 加 入 字 节 0X00 使 之 成 为 偶数 个 数据 。 在 读 取 BMP 压缩 文件 过 程 中 ,也 要 考虑 这 一 特 
点 ,判断 是 否 包含 多 余 的 字 节 。 

例 9-4: 设 有 一 幅 原 始 图 像 数据 如 下 ,以 16 色 BMP 文件 进行 压缩 。 

第 1 行 : 0X28 0X28 0X28 0X28 0X30 0X60 0X58 OX09 0X22 … 0X46 

0X46( 共 8 个 ) 

第 2 行 : 0X18 0X68 0X67 0X88 0X88 0X88 0X88 … 0X90 0X78 

根据 16 色 图 像 文 件 的 RLE4 编码 原理 ,压缩 后 的 图 像 数 据 为 : 

第 1 行 : OX08 0X28 0X00 0X0a 0X30 0X60 0X58 0X09 OX22 … 0X00 
0X10 0X46 OX00 0X00 

第 2 行 : 0X00 0X06 0X18 0X68 0X67 0X00 0X08 0X88 … OX00 0X04 
0X90 0X78 0X00 0X01 


9.3.5 算术 编码 


从 理论 上 分 析 ,采用 霍 夫 曼 编码 可 以 获得 最 佳 信 源 字符 编码 效果 ,但 是 实际 应 用 中 ,由 
于 信 源 字符 出 现 的 概率 并 非 满足 2 的 负 寡 次 方 ,因此 往往 无 法 达到 理论 上 的 编码 效率 和 信 
息 压 缩 比 。 以 信 源 字符 序列 {zyy} 为 例 说 明 如 下 : 

设 字符 序列 {zx,y} 对 应 的 概率 为 {1/3,2/3)},N, 和 NN, 分 别 表示 字符 zx 和 > 的 最 佳 码 
长 , 则 根据 信息 论 有 


N, log (地)= 1.58 (9-13) 


N, 一 log: (所)= 0. 588 (9-14) 


因此 ,字符 x、y 的 最 佳 码 长 分 别 为 1. 58bit 和 0. 588bit。 这 表明 ,要 获得 最 佳 编码 效 
果 , 需 要 采用 小 数码 字 长 度 。 然 而 对 于 数字 计算 机 而 言 , 这 是 不 可 能 实现 的 。 只 能 按 整 数位 
进行 , 即 采用 和 霍 夫 曼 方法 对 { zyy } 的 码 字 分 别 为 0 和 1, 也 就 是 两 个 符号 信息 的 编码 长 度 都 
为 1。 对 于 出 现 概率 大 的 字符 > 并 未 能 赋予 较 短 的 码 字 。 因 此 ,实际 编码 效果 往往 不 能 达 
到 理论 效率 。 为 提高 编码 效率 ,Elias 等 提出 了 算术 编码 算法 。 

1. 算术 编码 的 特点 

算术 编码 是 信息 保持 型 编码 , 它 不 像 霍 夫 曼 编码 ,无 须 为 一 个 符号 设 定 一 个 码 字 。 算 术 
编码 可 以 分 为 固定 方式 编码 和 自 适应 方式 编码 两 种 。 选 择 不 同 的 编码 方式 ,将 直接 影响 到 
编码 效率 。 自 适应 算术 编码 的 方式 ,无 须 先 定义 概率 模型 ,适合 于 无 法 知道 信 源 字符 概率 分 
布 的 情况 。 这 也 是 算术 编码 优 于 霍 夫 曼 编码 的 地 方 之 一 。 同 时 , 当 信 源 字符 出 现 的 概率 比 
较 接 近 时 ,算术 编码 效率 高 于 霍 夫 曼 编码 的 效率 ,在 图 像 通 信 中 常用 它 来 取代 和 堆 夫 曼 编码 。 
不 足 之 处 是 实现 算术 编码 算法 的 硬件 比 霍 夫 曼 编码 复杂 。 

2. 编码 原理 

算术 编码 的 方法 是 将 被 编码 的 信 源 消息 表示 成 0 一 1 之 间 的 一 个 间隔 , 即 小 数 区 间 , 消 
息 越 长 ,编码 表示 它 的 间隔 就 越 小 ,由 于 以 小 数 表 示 间 隔 ,因而 表示 的 间隔 越 小 所 需 的 二 进 
制 位 数 就 越 多 , 码 字 就 越 长 。 反 之 ,间隔 越 大 ,编码 所 需 的 二 进 制 位 数 就 少 , 码 字 就 短 。 信 源 
中 连续 符号 根据 某 一 模式 生成 概率 的 大 小 来 缩小 间隔 ,可 能 出 现 的 符号 要 比 不 太 可 能 出 现 
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的 符号 缩小 范围 少 ,只 增加 了 较 少 的 比特 。 

算术 编码 将 被 编码 的 图 像 数 据 看 作 是 由 多 个 符号 组 成 的 字符 序列 ,对 该 序列 递归 地 进 
行 算术 运算 后 ,成 为 一 个 二 进 制 分 数 。 在 接收 端 ,解码 过 程 也 是 算术 运算 ,由 二 进 制 分 数 重 
建 图 像 符号 序列 。 下 面 以 一 个 实例 来 说 明 算 术 编 码 的 基本 原理 。 

3. 编码 实例 

例 9-5: 算术 编码 示例 

设 图 像 信 源 编码 可 用 a、b、c、d 这 4 个 符号 来 表示 , 若 图 像 信 源 字符 集 为 {dacba) , 信 源 
字符 出 现 的 概率 分 别 如 表 9-9 所 示 ,采用 算术 编码 对 图 像 字 符 集 编码 。 


表 9-9 信 源 字符 出 现 概率 


信 源 字符 | a | 6 | < 四 
出 现 概率 0.4 0.2 0.2 0.2 
算术 编码 的 基本 步骤 如 下 : 
(1) 根据 已 知 条 件 和 数据 可 知 , 信 源 各 字符 在 区 间 [0,1] 内 的 子 区 间 间 隔 分 别 如 下 : 
a = [0; 050: 4) b= [0.4,0. 6) 
c= [0.6,0.8) ad = [0.8,1.0) 


(2) 计算 中 按 如 下 公式 产生 新 的 子 区 间 
Startw = Strats 十 Leftc XL 
Endw = Strats 十 Rightc XL 

式 中 ,Startv、\Endw 分 别 表示 新 子 区 间 的 起 始 位 置 和 结束 位 置 ;， Strats 为 前 一 子 区 间 的 
起 始 位 置 Leftc 、Rightc 分 别 表示 当前 符号 字 区 间 的 左 、 右 端 ; 工 为 前 子 区 间 的 长 度 。 

(3) 第 1 个 被 压缩 的 字符 为 d, 其 初始 子 区 间 为 [0. 8,1.0)。 

(4) 第 2 个 被 压缩 的 字符 为 a, 由 于 其 前 面 的 字符 取 值 区 间 为 [0. 8,1.0), 因 此 ,字符 
a 应 在 前 一 字符 区 间 间 隔 [0. 8.,1.0) 的 [0.0,0.4) 子 区 间 内 ,根据 式 (9-15) 可 得 

Starty 一 0.8 十 0.0X(1.0 一 0.8) = 0.8 
Endx 一 0.8 十 0.4X(1.0 一 0.8) = 0.88 

(5) 第 3 个 被 压缩 的 字符 为 c, 由 于 其 前 面 的 字符 取 值 区 间 为 [0. 8,0. 88) ,因此 ,字符 

< 应 在 前 一 字符 区 间 间 隔 [0.8,0. 88) 的 [0.6,0. 8) 子 区 间 内 ,根据 式 (9-15) 可 得 
Starty 一 0.8 十 0.6 X (0.88 一 0.8) = 0.848 
Endw 一 0.8 十 0.8X(0.88 一 0.8) = 0.864 

(6) 第 4 个 被 压缩 的 字符 为 6, 由 于 其 前 面 的 字符 取 值 区 间 为 [0. 848,0. 864) ,因此 , 字 

符 b 应 在 前 一 字符 区 间 间 隔 [0. 848,0. 864) 的 [0.4,0.6) 子 区 间 内 ,根据 式 (9-15) 可 得 
Startw = 0.848 十 0.4X (0.864—0.848) = 0. 8544 
Endw = 0.848 十 0.6 X (0.864— 0.848) = 0.8576 

(7) 第 5 个 被 压缩 的 字符 为 a, 由 于 其 前 面 的 字符 取 值 区 间 为 [0. 8544,0. 8) ,因此 ,字符 

a 应 在 前 一 字符 区 间 间 隔 [0. 8544,0.8576) 的 [0.0,0.4) 子 区 间 内 ,根据 式 (9-15) 可 得 
Startw = 0. 8544 + 0.0 xX (0.8576— 0.8544) = 0. 8544 
Endw = 0.8544 十 0.4X (0.8576—0.8544) = 0. 85568 


(9-15) 


像 编码 |l 萝 229 


230 十 || 数字 图 像 处 理 及 应 用 一 一 使 用 MATLAB 分 析 与 实现 


(8) 经 过 上 述 计算 ,字符 集 {dacba} 被 描述 在 实数 [0. 8544,0. 85568) 子 区 间 内 , 即 该 区 
间 内 的 任 一 实数 值 都 唯一 对 应 该 字符 序列 {dacba}。 因 此 ,可 以 用 [0. 8544,0. 85568) 内 的 一 
个 实数 表示 字符 集 {dacba)})。 

(9) [0. 8544, 0. 85568 ) 子 区 间 的 二 进 制 表示 形式 为 [0. 1101101010000110， 
0.1101101100001101) ,在 该 区 间 内 的 最 短 二 进 制 代码 为 0. 11011011 ,去 掉 小 数 点 及 其 前 的 
字符 ,从 而 得 到 该 字符 序列 的 算术 编码 为 11011011 。 

如 果 所 需要 编码 的 字符 信息 更 长 ,还 可 以 依 此 类 推 地 继续 运算 下 去 。 随 着 被 编码 字符 
的 增加 ,区 间 越 来 越 小 , 则 编码 产生 的 二 进 制 码 越 来 越 长 。 

算术 编码 可 以 通过 硬件 电路 实现 ,在 上 述 乘 法 运算 中 ,可 以 通过 右 移 来 实现 ,因此 在 算 
术 编 码 算法 中 只 有 加 法 和 移 位 运算 。 

4. 算术 编码 效能 

根据 上 述 运 算 结 果 , 编 码 11011011 唯一 代表 字符 序列 {dacba} ,因此 ,平均 码 字 长 度 为 

RR 一世 一 1.6bit/ 字符 

由 此 可 得 出 ,算术 编码 具有 很 高 的 编码 效率 ,大 量 数据 表明 ,算术 编码 一 般 比 霍 夫 曼 编 
码 效能 高 5% 以 上 。 虽 然 该 例 给 出 的 是 一 个 二 进 制 的 算术 编码 的 实例 , 它 可 以 看 作 多 进 制 
算术 编码 的 特例 ,多 进 制 编码 的 原理 与 此 类 似 。 在 H. 263 视频 编码 标准 中 ,就 是 将 算术 编 
码 作为 一 个 选项 来 代替 霍 夫 曼 编码 ,以 期 提高 VLC 的 效率 。 


9.4 位 平面 编码 


位 平面 编码 又 称 为 比特 平面 编码 ,位 平面 编码 是 一 种 通过 单独 地 处 理 图 像 的 位 平面 来 
减少 像素 间 宛 余 的 有 效 技术 。 它 将 一 幅 多 级 图 像 分 解 为 一 系列 二 值 图 像 并 采用 几 种 熟知 的 
二 值 图 像 压缩 方法 对 每 一 幅 二 值 图 像 进行 压缩 。 位 平面 编码 分 为 两 个 步骤 : 位 平面 分 解 和 
位 平面 编码 。 


9.4.1 位 平面 二 值 分 解 


对 于 256 灰 度 级 (位 深度 为 8) 的 灰 度 图 像 ,每 一 个 像素 的 灰 度 值 可 用 8 位 二 进 制 数 表 
示 , 若 灰 度 图 像 的 每 一 个 像素 点 均 以 二 进 制 表 示 其 灰 度 值 , 且 均 按 从 低位 (b0) 到 高 位 (b7) 
的 顺序 排列 二 进 制 位 , 则 取 全 部 像素 点 的 bb 一 b7 , 原 图 像 可 以 形成 8 个 二 进 制 位 平面 图 ,如 
图 9-4 所 示 。 

一 幅 比特 的 灰 度 图 像 的 灰 度 级 可 以 用 2 为 基 的 。 gbit 的 字 节 
多 项 式 表示 为 

ri2o: 十 da2" 十 十 a12!: 十 ao2" (9-16) 

式 中 ,a; 二 0 或 1。 

根据 上 式 , 将 多 项 式 的 n 个 系数 分 离 到 n 个 1bit 
的 位 平面 中 ,这 就 实现 了 将 一 幅 多 级 灰 度 图 像 表 示 成 
由 n 个 二 值 图 像 组 成 的 集合 。0 级 位 面 就 是 原 图 像 灰 位 面 0 
度 级 的 第 0 位 ,也 就 是 由 上 式 从 右 往 左 中 的 第 一 位 生 ”图 94 灰 度 图 像 的 位 平面 示意 图 


史 
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成 的 ,n 一 1 级 位 面 就 是 原 图 像 灰 度 级 的 第 一 1 位 ,是 由 上 式 中 的 系数 生成 的 ,每 个 位 面 根 
据 其 系数 按 0 到 "一 1 进行 编号 ,位 平面 每 个 像素 的 取 值 等 于 原 图 像 的 每 个 像素 点 的 灰 度 值 
基于 上 式 所 对 应 的 多 项 式 系数 。 

采用 上 述 表达 式 分 解 理论 上 可 导致 一 个 应 引起 注意 的 问题 , 即 对 于 某 些 特殊 的 灰 度 级 ， 
当 灰 度 值 发 生 增 ( 减 ) 变 化 时 ,将 会 使 位 平面 产生 显著 的 响应 。 例 如 ,对 于 一 个 8 位 的 灰 度 图 
像 , 当 灰 度 从 127 过 渡 到 128 时 ,8 个 位 面 的 值 从 01111111 变 成 10000000,8 个 位 面 的 值 全 

例 9-6: 位 平面 分 解 示例 

对 如 图 9-5(a) 所 示 的 图 像 进行 位 平面 分 解 ,图 9-5(b) 一 图 9-5(iD 依 次 为 最 高 位 7 至 最 
低位 0 的 位 平面 图 。 位 平面 二 值 码 分 解 的 MATLAB 代码 如 下 : 

名 灰 度 图 像 的 二 进 制 位 平面 分 解 代码 


ele 


clear all; 
X= double( imread( 'C:\Users\chen\Desktop\lena. bmp') ); 
[hw] = size(X); 
subplot(3,3,1); 
imshow(X, []); 
title( ' 原 始 图 像 '); 
fork=1:8 
for i=1:h 
for j=1:w 
% bitget 将 Xx(i,j) 处 灰 度 值 分 解 为 二 进 制 串 ,然后 取 第 k 位 
tmp(i,j) = bitget(X(i,j),k); 
end 
end 
subplot(3,3,9—k+1); 
imshow( tmp, [ ]); 
ind = num2str(k— 1); 
imti = [' 第 ', ind, ' 个 位 平面 ']; 
title( imti); 
end 


根据 该 例 的 实验 结果 ,256 级 灰 度 图 像 的 位 平面 编码 中 ,从 图 9-5(b) 一 图 9-5(iD, 即 从 
高 位 到 低位 ,视觉 可 见 的 有 意义 的 信息 逐渐 减少 ,以 前 5 位 包含 的 图 像 信 息 最 多 ,后 三 个 位 
平面 所 包含 的 图 像 信息 较 少 ,主要 是 图 像 局 部 的 小 的 细节 信息 ,低位 的 位 平面 的 甚至 可 以 认 
为 是 噪声 信息 。 


9.4.2 有 灰 度 码 分 解 

为 了 避免 位 平面 编码 方法 中 二 值 分 解法 出 现 的 这 种 某 些 灰 度 值 稍微 变化 引起 全 部 位 平 
面 变化 的 情况 ,可 以 采取 先 对 灰 度 级 进行 编码 。 首 先 用 一 个 m 比特 的 灰 度 编码 来 表示 图 
像 ,编码 计算 公式 为 


ii 四 aa 0 委 i 委 2 一 1 
一 (9-17) 
as i=n—1 


232 本 || 数字 图 像 处 理 及 应 使 用 MATLAB 分 析 与 实现 


(g) 第 2 个 位 平面 (h) 第 1 个 位 平面 ( 个 位 平面 
图 9-5 位 平面 编码 的 8 位 二 值 分 解 图 


根据 上 式 进行 分 解 称 为 位 平面 的 灰 度 码 分 解法 ,又 称 为 格雷 码 , 其 结果 仍 是 二 值 位 平面 
图 。 由 于 上 式 采 用 了 蜡 或 运算 ,使 得 连续 码 字 之 间 仅 有 一 个 比特 位 置 不 相同 ,因此 避免 了 某 
些 特殊 灰 度 值 因 小 的 变化 引起 整个 位 面 产生 变化 。 仍 以 前 面 提 到 的 灰 度 值 由 127 增 1, 变 
为 128 为 例 ,如 果 采 用 格雷 码 分 解 , 则 仅 有 第 7 个 位 平面 从 0 变 为 1, 其 他 位 平面 没有 发 生 
变化 ,此 时 ,对 应 127 和 128 的 格雷 码 分 别 为 01000000 和 11000000。 

灰 度 图 像 经 过 分 解 之 后 ,8 个 位 面 的 图 像 都 是 灰 度 值 仅 为 0 和 1 的 二 值 图 像 ,图 像 中 存 
在 着 很 多 0 或 者 1 的 连通 区 域 ,对 这 类 二 值 图 像 通常 可 以 采用 行程 长 度 编 码 (RLC) 、 常 数 块 


编码 (CAC) 等 方法 进行 图 像 编码 。 


9.5 预测 编码 


预测 编码 是 指 依据 某 一 模型 ,根据 以 往 的 样本 值 对 于 新 样本 值 进行 预测 ,然后 将 样本 的 
实际 值 与 预测 值 相 减 得 到 一 个 误差 值 ,对 这 一 误差 值 进行 编码 。 如 果 模 型 足够 好 且 样本 序 


到 


第 9 章 


像 编码 | 有 > 233 


列 在 时 间 和 空间 上 存在 较 强 的 相关 性 ,那么 误差 信号 的 幅度 将 远 远 小 于 信 源 原始 信号 ,从 而 
可 以 用 较 少 的 电 平 量 对 其 差 值 量化 得 到 较 大 的 数据 压缩 结果 。 预 测 编码 分 为 线性 预测 和 非 
线性 预测 两 类 。 

车 能 找到 一 个 数学 模型 可 以 完全 代表 数据 源 , 那 么 在 接收 端 就 能 依据 这 一 数学 模型 准 
确 无 误 地 产生 出 这 些 数据 。 但 没有 一 个 实际 的 系统 能 找到 其 完全 准确 的 数学 模型 ,因此 ,最 
好 的 办 法 是 采用 预测 器 以 某 种 最 小 化 的 误差 方法 对 下 一 个 样本 进行 预测 。 


9.5.1 DPCM 的 工作 原理 


在 线性 预测 中 ,最 常用 的 是 差分 脉冲 编码 调制 , 即 DPCM (differential pulse code 
modulation) ,Oliver 在 1952 年 对 图 像 线 性 预测 法 进行 了 理论 研究 ,1958 年 ,Graham 用 计算 
机 进行 了 DPCM 模拟 。DPCM 的 工作 原理 如 图 9-6 所 示 ,主要 是 基于 图 像 中 相 邻 像素 之 间 
的 数据 具有 较 强 的 相关 性 ,每 个 像素 可 以 根据 以 前 已 知 的 几 个 像素 值 进 行 预测 。 在 DPCM 
编码 中 ,编码 和 传输 的 不 是 像素 值 本 身 ,而 是 这 个 取样 值 的 预测 值 。 


人 | 量化 器 |] 全 -| 纺 g 吕 | 
» il ,上 
一 一 一 阁 
mi 闻 发 关 肖 | | 信道 


图 9-6 DPCM 系统 原理 框图 


其 中 ,zw 为 LN 时 刻 的 亮度 取样 值 ; zw 为 预测 器 根据 4 时 刻 之 前 的 样本 值 zl,zz， 
za，…ZN-1 对 zx 所 做 的 预测 值 ; en 为 差 值 信 号 , 即 
ev = ZN — ZN (9-18) 
量化 器 对 ew 进行 量化 得 到 ev ,编码 器 对 ev 进行 编码 。 接 收 端 解码 时 的 预测 过 程 与 发 送 
端 相同 ,所 采用 的 预测 器 也 相同 。 接 收 端 恢复 的 输出 信号 zx 是 zx 的 近似 值 , 两 者 的 误差 为 
AzrN ZN (Zn — én) XN— XN= eNO— EN (9-19) 
当 Azw 足够 小 时 ,输入 信号 zy 和 DPCM 系统 的 输出 信号 zw 接近 一 致 。 
9.5.2 线性 预测 编码 
在 图 像 信 源 数据 序列 中 ,由 zzz ,zs,…:zv-i 对 zw 进行 预测 。 由 于 是 对 zx 进行 线性 
预测 ,因此 , 令 zw 的 预测 值 (估计 值 ) 为 zv, 则 zw 是 zi,zz ,zs,… ,zw-i 的 线性 组 合 。 


设 二 维 图 像 信号 xz(7) 是 均值 为 零 、 方 差 为 o 的 平稳 随机 过 程 ,x(0) 在 ,ts st3，… ,ln-1 
时 刻 的 抽样 值 分 别 为 mi ,zz ,x3，,… ,zw-1. 那 么 tw 时 刻 抽样 的 线性 预测 值 为 
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ZN = Wg = alizl 十 azzzs 十 asZs 十 … 十 aNiIZN-1 (9-20) 
式 中 ,a 为 枯 测 系数 , 即 待定 常数 。 
车 各 a; 确定 , 则 可 以 根据 上 式 构成 线性 预测 器 。 根 据 线 性 预测 定义 ,zw 应 非常 逼近 
ZN， 这 就 要 求 各 w 为 最 佳 系数 。 采 用 均 方 误差 最 小 的 准则 ,可 求 得 各 最 佳 的 系数 。 
现 定 义 zw 的 均 方 误差 为 
E{[enJ:} = E{[zn — zn]’} (9-21) 
为 使 E{[en]} 最 小 ,对 式 (9-21) 微 分 可 得 


3E{Lew}= EtLzn — ny) 
到 


= 3E {Lz — (a 十 azzz 十 aszs 十 "十 Qn-iZw-1)]} 


2E{[zxn— (axziaszs 十 aszs 十 … 十 aN-iZzNi)zi]) (9-22) 
式 中 ,i=1,2,3,*…,N 一 1 
根据 极 值 条 件 , 可 得 如 下 N 一 1 个 线性 方程 组 : 


尼 {[zn 一 (aizl 十 azzz 十 aszs 十 … 十 aN-izNi)zl) = 


0 
忆 {[zx 一 (aizi 十 azzs 十 asrzs 十 … 十 aizNi)zs 一 0 
0 (9-23) 


下 {[zn 一 (aizl 十 azzs 十 asrzs 十 … 十 aizNi)zs} = 


下 {[Lzw 一 (aizi 十 azzs 十 aszs 十 … 十 aiZzNi)zwi 一 0 
该 方程 可 表示 为 
玖 {[zx 一 (aizi 十 azzz 十 aszs 十 … 十 awizNi)zi]} 一 0 
全 王 1,2,3，…… 和 一 1) 
令 xz; 和 x) 的 协 方差 为 
Ry = E[zxisx;] ij = 1,2,3,°,N—1 (9-24) 
则 上 式 可 以 表示 为 


N=1 
Ry - onli auRy + azR;; + asRs; 中 "ee an-uR ni (9-25) 
k=0 


车 所 有 的 协 方差 R; 已 知 或 可 以 测 出 时 , 则 通过 上 式 可 计算 出 N 一 1 个 预测 系数 a;。 

综 上 所 述 ,可 以 得 出 以 下 几 点 结论 : 

(1) 预测 模型 的 复杂 程度 取决 于 线性 预测 中 使 用 以 前 的 样本 数目 ,样本 点 越 多 , 则 预测 
器 越 复杂 ,最 简单 的 预测 仅 使 用 前 一 个 样本 点 , 称 为 前 值 预测 。 

(2) 若 采用 z 的 同一 行 中 zw 的 若干 已 知 像素 样本 值 ,如 ri ,zz ,za,，…,zN-1i 来 对 zw 进 
行 预测 , 则 称 为 一 维 预 测 。 

(3) 若 采用 同一 行 及 前 几 行内 的 已 知 像素 样本 值 来 预测 zw , 则 称 为 二 维 预测 。 

(4) 若 采用 的 已 知 像素 不 仅 是 前 几 行 的 ,而 且 还 包括 前 几 帧 的 ， 


那么 则 称 为 三 维 预 测 。 2 
图 9-7 所 示 是 一 个 简单 的 .在 JPEG 无 损 编码 方案 中 采用 的 实 | _ 


际 预测 器 , 它 给 出 了 静止 图 像 的 一 个 完整 的 二 维 预 测 器 。 它 只 考虑 图 9%-7 预测 器 的 组 成 


及 
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临近 3 点 A、B 和 C 的 值 ,例如 ,以 A、B 或 C 作为 Y 的 预测 值 , 则 共有 如 表 9-10 所 示 的 多 种 
线性 预测 方法 。 

表 9-10 YY 的 预测 值 方法 
预测 方法 0 1 2 3 4 5 6 7 
A-C A+B 


预测 值 六 非 预测 4A|B|c|A+Bs-c|4+ 


9.5.3 非 线 性 预测 


线性 预测 编码 的 基础 和 前 提 是 将 整个 图 像 域 视 为 一 个 平稳 随机 过 程 ,其 自 相关 系数 与 
像素 在 图 像 信 源 数据 域 中 的 位 置 无 关 。 而 实际 上 ,图 像 的 起 伏 变 化 是 始终 存在 的 ,被 描述 的 
像素 和 周围 像素 之 间 存 在 多 种 多 样 的 关系 。 线 性 预测 系数 是 一 种 近似 条 件 下 的 常数 , 它 忽 
咯 了 不 同 像素 之 间 的 个 性 条 件 , 因 此 存在 一 些 不 足 。 

非 线性 预测 针对 线性 预测 的 不 足 , 充 分 考虑 了 图 像 的 统计 特性 和 图 像 信 源 数据 的 个 别 
变化 情况 , 即 力求 使 预测 系数 与 图 像 的 实际 局 部 特性 相 一 致 ,通过 使 预测 系数 随 预 测 条 件 而 
变化 ,从 而 进一步 提高 压缩 编码 的 性 能 。 


9.6 图 像 的 变换 编码 


变换 编码 主要 包括 DFT 变换 、K-L 变换 WHT 变换 .DCT 变换 和 小 波 变 换 编码 等 , 变 
换 编码 因为 其 独特 的 编码 效果 ,已 经 成 为 一 种 得 到 广泛 应 用 的 图 像 压缩 编码 方法 。 


9.6.1 变换 编码 的 基本 原理 


图 像 变 换 编码 的 基本 思想 是 将 空域 中 描述 的 图 像 数 据 经 过 某 种 变换 ,如 DFT 变换 、 
DCT 变换 、K-L 变换 等 二 维 正 交 变换 ,转换 到 新 的 变换 域 中 进行 描述 ,在 变换 域 中 达到 改变 
能 量 分 布 的 目的 ,将 图 像 能 量 在 空间 域 的 分 散 分 布 变 为 在 变换 域 中 的 相对 集中 分 布 ,从 而 实 
现 对 信 源 图 像 数 据 的 有 效 压 缩 。 

变换 编码 的 基本 流程 如 图 9-8 所 示 , 图 像 数 据 经 过 某 种 变换 量化 和 编码 (通常 为 变 长 
编码 ) 后 由 信道 传输 到 接收 端 ,接收 端 进行 相反 的 处 理 , 即 解码 、 反 量化 以 及 首 变 换 , 然 后 输 
出 原 图 像 数据 。 

输入 


变换 :改编 和 
(DCT 、 小波 变换 等 ) “| 量化 站 一 一 | 变 长 编码 


输出 


逆 变 换 反 量化 ”| 一 变 长 编码 


图 9-8 变换 编码 .解码 工作 流程 图 
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图 像 数 据 经 过 正 交 变 换 后 ,空域 中 的 总 能 量 在 变换 域 中 得 到 保持 ,但 能 量 将 会 重新 分 
布 ,并 集中 在 变换 域 中 少数 的 变换 系数 上 ,以 达到 压缩 数据 的 目的 。 


9.6.2 正 交 变换 的 物理 意义 


通常 情况 下 ,变换 编码 都 会 选择 正 交 变 换 , 正 交 变 换 是 一 种 数据 处 理 手 段 , 它 将 被 处 
理 的 图 像 信 源 数据 按照 正 交 变 换 规则 映射 到 另 一 个 域 进行 处 理 。 由 于 图 像 是 以 二 维 矩 
阵 表示 的 ,所 以 在 图 像 编码 中 多 采用 二 维 正 交 变换 形式 。 图 像 数 据 正 交 变换 后 不 改变 信 
源 的 值 ,变换 前 后 图 像 的 信息 量 没有 损失 ,完全 可 以 通过 对 应 的 逆 变 换 得 到 原来 的 图 
像 数 据 。 但 统计 分 析 表 明 ,经 过 正 交 变换 后 ,数据 的 分 布 规律 发 生 了 很 大 的 改变 ,像素 之 
间 的 相关 性 下 降 ,变换 系数 向 新 坐标 系 中 的 少数 坐标 集中 ,一 般 集 中 于 少数 的 直流 或 低 
频 分 量 的 坐标 点 。 变 换 编码 将 统计 上 高 度 相关 的 像素 所 构成 的 矩阵 通过 正 交 变 换 , 变 成 
统计 上 彼此 较为 独立 甚至 达到 完全 独立 的 变换 系数 矩阵 ,以 达到 压缩 数据 的 目的 ,这 就 
是 图 像 变换 。 

需要 指出 的 是 ,如 果 将 整个 图 像 作为 一 个 二 维和 矩阵 , 则 变换 处 理 运算 量 太 大 ,难以 实现 。 
所 以 在 实用 中 , 先 将 一 幅 图 像 分 割 成 若干 小 的 图 像 子 块 ,如 8X8 或 16X16 小 方块 ,各 图 像 
子 块 的 像素 值 都 可 以 看 成 为 一 个 二 维 数据 矩阵 ,变换 是 以 这 些 图 像 子 块 为 单位 进行 的 。 

如 图 9-9 所 示 ,zx, 和 zs 分 别 表示 两 个 像素 的 亮度 取 值 ,对 于 图 9-9(a) 所 表示 的 阴影 区 
域 而 言 , 相 邻 像素 之 间 存 在 相关 性 , 绝 大 多 数 相 邻 两 像素 灰 度 值 接近 或 相等 ,图 中 阴影 部 分 
表示 像素 zi 与 zs 同时 出 现 相近 亮度 值 的 可 能 性 。zi 、z; 的 相关 性 越 强 , 则 阴影 部 分 就 更 
扁 长 ,这 时 图 像 在 za 、zs 方向 上 的 能 量 都 较 大 。zi、\zs 的 相关 性 越 弱 , 则 阴影 部 分 呈 圆 形 
状 , 说 明 zi 处 于 某 一 亮度 值 时 ,zs 可 能 出 现在 不 相同 的 任意 亮度 值 上 。 

图 9-9(b) 表 示 , 若 对 该 数据 进行 正 交 变 换 , 几 何 上 即 相当 于 坐标 系 逆 时 钟 旋转 45°, 成 
为 yi 与 ys 坐标 系 , 这 时 阴影 部 分 正好 处 于 wm 轴 附 近 , 若 阴影 部 分 越 长 , 则 在 w 轴 上 的 投 
影 就 越 大 ,而 在 y; 轴 上 的 投影 就 越 小 ,这 表明 图 像 的 能 量 都 集中 分 布 在 w 方向 上 。 


图 9-9 正 交 变 换 的 物理 概念 


由 图 9-9 可 以 看 出 ,变换 前 zx 和 zs 存在 较 大 的 相关 性 ,能 量 分 布 集中 在 直线 zi 一 zs 
附近 。 变 换 后 ,能量 集中 在 y 方向 上 ,无论 阴影 部 分 在 mm 轴 上 怎样 变化 ,y 轴 上 的 变化 都 
非常 小 ,这 说 明 w 与 y; 的 相关 性 减少 ,像素 之 间 表现 出 独立 性 。 因 此 ,经 过 对 图 像 信 源 数 
据 进 行 正 交 变换 ,图像 数 据 的 相关 性 降低 ,通过 在 新 的 变换 域 中 选择 合理 的 量化 方法 就 能 达 
到 压缩 图 像 数 据 的 目的 。 
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9.6.3 变换 类 型 与 子 块 大 小 的 选择 


根据 数字 信号 处 理 理论 ,所 有 正 交 变 换 中 以 K-L 变换 性 能 最 优 , 经 K-L 变换 后 各 变换 
系数 在 统计 上 不 再 相关 ,其 协 方差 矩阵 为 对 角 阵 ,因而 大 大 减少 了 图 像 原 始 数 据 的 元 余 度 。 
因此 ,K-L 变换 能 完全 消除 图 像 子 块 内 像素 间 的 相关 性 , 若 舍弃 一 些 特征 值 较 小 的 变换 系 
数 ,那么 所 引起 的 均 方 误差 是 所 有 正 交 变换 中 最 小 的 。 巾 于 K-L 变换 是 以 原始 图 像 各 子 块 
协 方差 矩阵 的 特征 向 量 作为 变换 后 的 基 向 量 , 因 此 K-L 变换 的 基 对 不 同 图 像 是 不 同 的 ,与 
编码 对 象 的 统计 特性 有 关 , 这 种 变换 基 的 不 确定 性 使 得 K-L 变换 在 应 用 中 不 方便 。 因 此 ， 
尽管 K-L 变换 具有 许多 主要 优点 ,但 一 般 只 用 于 进行 理论 上 的 比较 。 

DFT 变换 是 应 用 最 早 且 非常 成 熟 的 变换 之 一 ,性 能 接近 于 最 佳 , 且 具 有 快速 算法 ,其 不 
足 之 处 在 于 图 像 子 块 的 变换 系数 在 边界 处 不 连续 而 造成 恢复 后 的 图 像 子 块 边界 也 不 连续 
( 即 存在 Gibbs 现象 ) ,于 是 由 子 图 像 构成 的 整 幅 图 像 将 呈现 隐约 可 见 的 以 图 像 子 块 为 形状 
的 小 块 状 结构 ,影响 了 图 像 质量 ,一定 程度 上 影响 了 其 应 用 。 

DCT 变换 是 图 像 变换 中 应 用 得 最 多 的 变换 编码 ,其 性 能 接近 于 K-L 变换 , 且 变 换 矩 阵 
与 图 像 内 容 无 关 。 根 据 DCT 变换 的 特点 ,还 可 避免 DFT 变换 中 图 像 子 块 边界 处 产生 的 晶 
路 与 Gibbs 现象 。 此 外 ,市 场 上 拥有 许多 基于 DCT 快速 算法 的 ASIC 芯片 ,因此 ,DCT 变 
换 已 经 成 为 图 像 变 换 编码 的 主流 。 目 前 ,JPEG、MPEG、H. 263 等 国际 编码 标准 都 选择 采用 
DCT 变换 模块 。 

沃 尔 什 变 换 与 DCT 变换 相 比 ,其 算法 简单 ,因而 运算 速度 较 快 ,适用 于 高 速 实时 系统 ， 
而 且 实 现 该 算法 的 硬件 结构 简单 ,不 足 之 处 是 性 能 比 DCT 变换 差 。 

确定 变换 方式 之 后 ,还 需要 选择 变换 块 的 大 小 。 由 于 压缩 的 依据 是 基于 子 块 内 图 像 像 
素 间 的 相关 性 , 若 子 块 选 得 太 小 ,不 利于 压缩 比 的 提高 。 理 论 上 , 子 块 越 大 , 计 入 的 相关 像素 
就 越 多 ,压缩 比 就 越 大 。 但 如 果子 块 过 大 , 则 计算 量 太 大 ,同时 考虑 到 距离 较 远 的 像素 间 相 
关 性 并 不 高 ,实际 上 过 大 的 子 块 对 压缩 比 的 提高 效果 反而 不 好 。 因 此 ,图 像 变换 一 般 选 择 采 
用 8X8 或 16X16 大 小 的 子 块 。 


9.6.4 变换 编码 的 步骤 
根据 图 像 变 换 编 码 的 原理 以 及 图 9-8 所 示 的 编码 ,解码 逻辑 流程 ,实现 变换 编码 一 般 包 


含 以 下 步骤 。 
1. 原始 图 像 分 块 
根据 编码 的 具体 要 求 ,将 图 像 划 分 为 若干 NXN 的 子 块 , 即 
Too To ”Ton 
10 Xu “ND 
= | zao Tal “TaN (9-26) 
TON-D0 TND TN-DN-D 


通常 情况 下 N 取 值 为 8 或 16。 图 像 分 块 之 后 ,应 同时 根据 编码 的 性 能 要 求 , 综 合 考虑 
相关 要 素 ,选择 变换 矩阵 4 对 各 图 像 子 块 进行 相应 的 正 交 变 换 。 
设 工 表示 变换 域 中 的 图 像 数据 , 则 可 表示 为 
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Y=AX (9-27) 

2. 变换 域 采样 

即 对 变换 域 中 的 系数 进行 取舍 。 

3. 系数 量化 

由 于 变换 之 后 的 系数 是 不 相关 的 ,因此 具有 更 大 的 独立 性 和 有 序 性 ,利用 量化 使 图 像 数 
据 得 到 压缩 。 量 化 是 产生 有 损 压 缩 的 原因 ,因此 应 选择 合适 的 量化 方法 ,以 使 量化 失真 最 
小 。 均 方 误差 是 衡量 各 种 变换 编码 效能 的 一 个 重要 准则 ,该 准则 可 在 较 高 的 压缩 比 和 一 定 
的 允许 失真 度 之 间 寻 求 一 个 较 理 想 的 .可 用 的 变换 编码 方式 。 

均 方 误差 定义 为 


JI 
b> -| (9-28) 
i=0 


式 中 ,yy 为 ys 的 量化 值 。 

20 世纪 50 年 代 期 间 ,Panter、Dire 和 Max 研究 了 使 单个 系数 均 方 误差 极 小 化 的 量化 方 
案 。 研 究 发 现 ,如 果 yi 的 概率 密度 函数 是 均匀 的 ,那么 具有 均匀 间隔 输出 的 量化 器 是 最 佳 
的 。 对 于 其 他 的 分 布 ,使 用 非 均 匀 量 化 器 则 能 够 起 到 减 小 均 方差 的 作用 。 

4. 解码 与 反 变换 

在 变换 编码 系统 的 接收 端 对 所 接收 的 比特 流 进行 解码 ,分 离 出 各 变换 系数 y; ,并 进行 
系数 的 舍 信 ,被 舍弃 的 系数 均 以 0 代替 ,并 进行 逆 变 换 运 算 ,恢复 各 图 像 子 块 及 整 幅 图 像 。 


9.7 JPEG 标准 


JPEG 是 联合 图 片 专家 组 的 简称 (joint photographic experts group) ,JPEG 专门 致力 于 
对 静止 图 像 压 缩编 码 技 术 的 研究 ,该 组 织 于 1991 年 3 月 公布 了 对 静止 彩色 图 像 和 灰 度 图 像 
(也 称 为 连续 色调 图 像 ) 的 压缩 标准 一 一 JPEG 标准 。JPEG 是 面向 静态 图 像 编码 的 国际 标 
准 。 在 相同 图 像 质量 条 件 下 ,JPEG 文件 拥有 比 其 他 图 像 文件 格式 更 高 的 压缩 比 ,JPEG 标 
准 于 1992 年 正式 通过 并 作为 ISOVIEC 10918 标准 公布 。 


9.7.1 JPEG 基本 系统 


JPEG 目前 被 广泛 应 用 于 多 媒体 和 网 络 程序 中 ,是 现今 万 维 网 中 使 用 最 广泛 的 两 种 图 
像 文 件 格式 之 一 。JPEG 是 一 种 有 损 压 缩 , 即 在 压缩 过 程 中 会 丢失 数据 ,每 次 编辑 JPEG 图 
像 后 ,图 像 就 会 被 重新 压缩 一 次 ,图 像 信息 损失 会 有 所 增加 。 

JPEG 根据 不 同 的 应 用 场合 对 图 像 的 压缩 要 求 提出 了 几 种 不 同 的 编码 和 解码 方法 , 主 
要 可 以 分 为 以 下 三 个 层次 的 系统 : 

(1) 基本 系统 。 

(2) 扩展 系统 。 

(3) 无 损 压 缩 系统 。 

所 有 符合 JPEG 标准 的 编 解码 器 都 必须 支持 基本 系统 ,而 其 他 系统 则 作为 不 同 应 用 目 
的 的 可 选项 , 即 一 个 符合 JPEG 标准 的 编 解 码 器 至 少 应 满足 基本 系统 的 技术 指标 。JPEG 
标准 还 包括 将 图 像 质 量 控制 在 可 视 保 真 度 高 的 范围 内 ,可 以 设置 压缩 或 质量 水 平 ,同时 编码 


到 
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器 可 被 参数 化 ; 压缩 标准 可 以 应 用 于 任何 一 类 连续 色调 数字 图 像 , 并 不 应 受到 维 数 、 颜 色 、 
画面 尺寸 内容 、 影 调 的 限制 ; 压缩 标准 必须 从 完全 无 损 到 有 损 范 围 内 可 选 , 以 适应 不 同 的 
存储 .CPU 和 显示 要 求 。JPEG 允许 如 下 4 种 编码 模式 : 

(1) 基本 顺序 模式 编码 。 从 左 到 右 、 从 上 到 下 对 图 像 顺序 进行 基于 DCT 变换 编码 , 虽 
然 理 论 上 DCT 变换 是 可 道 的 ,但 由 于 计算 时 存在 误差 ,实际 上 基于 DCT 的 编码 模式 是 一 
种 有 损 编码 。 

(2) 渐进 式 DCT 方式 编码 。 基 于 DCT 方式 编码 ,对 图 像 分 层次 进行 处 理 , 从 模糊 到 清 
晰 地 传输 图 像 (类 似 于 GIF 文件 的 交错 方式 ), 具 有 频谱 选择 和 逐次 通 近 两 种 实现 方法 。 

@ 频谱 选择 法 : 按 Z 形 扫 描 的 序号 将 DCT 量化 序数 分 成 几 个 频段 ,每 个 频段 对 应 一 
次 扫描 ,每 块 均 先 传送 低频 扫描 数据 ,得 到 原 图 概 瑶 , 再 依次 传送 高 频 扫 描 数 据 , 使 图 像 逐 渐 
清晰 。 

@ 逐次 逼近 法 : 即 每 次 扫描 全 部 DCT 量化 序数 ,但 每 次 的 表示 精度 逐渐 提高 。 

(3) 预测 无 损 编码 。 使 用 线性 预测 器 ,如 DPCM 等 ,而 不 是 基于 DCT。 

(4) 分 层 模式 编码 。 在 空间 域 将 信 源 图 像 以 不 同 的 分 辩 率 表示 ,每 个 分 辩 率 对 应 一 次 
扫描 ,处 理 时 可 以 基于 DCT 或 预测 编码 ,可 以 是 渐进 式 ,也 可 以 是 顺序 式 。 


9.7.2 JPEG 编码 方法 


基本 的 JPEG 算法 属于 变换 类 编码 ,基于 DCT 顺序 式 的 基本 系统 编码 流程 如 图 9-10 
所 示 。 


量化 表 编码 表 
_ 
源 图 像 | 一 “色彩 办 所 ”一 一 [8xs 数 据 块 | 一 -| DCT 变换 | 一 | 虽 化 |- 
压缩 
数据 
恢复 的 图 像 数据 |= IDCT |- 一 | 反 量化 | 一 | 类 解码 
量化 表 | 编码 表 


图 9-10 JPEG 编码 流程 图 


1. 颜色 空间 转换 
虽然 JPEG 标准 可 以 压缩 通常 的 RGB 分 量 , 但 在 YCvC, 空间 的 压缩 效果 会 更 好 ,其 中 
Y 代表 亮度 , Cs,、C: 代表 色 度 。 这 是 因为 人 的 视觉 对 色彩 的 变化 不 如 对 亮度 的 变化 敏感 , 因 
而 对 色彩 的 编码 可 以 比 对 亮度 的 编码 粗糙 些 ,这 主要 体现 在 不 同 的 采样 频率 和 量化 精度 上 。 
在 JPEG 系统 中 ,将 彩色 图 像 进行 数据 压缩 之 前 必须 对 颜色 模式 进行 转换 ,将 RGB 模式 转 
为 YCsC 模式 。 转 换 公式 为 
立 一 0.299R 十 0.587G 十 0.114B 
Cs = 一 0.169R 一 0.3313G 十 0.5B (9-29) 
C. = 0.5R 一 0.4187G 一 0.0813B 
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将 颜色 空间 转换 后 进行 数据 采样 ,由 于 亮度 比 色 彩 更 重要 ,因而 对 Y 分 量 的 采样 频率 
可 高 于 对 Cs、C 的 采样 频率 ,这 样 有 利于 节省 处 理 系 统 的 存储 空间 ,常用 的 采样 方案 有 
YUV422 和 YUV411, 即 采样 比例 为 4: 2: 2 或 4: 1: 1 方式 (对 灰 度 图 像 而 言 , 只 有 一 
个 了 分 量 )。 这 样 的 采样 方式 是 基于 视觉 对 亮度 要 比 对 色 度 更 敏感 ,而 重建 后 的 图 像 与 原 图 
的 差异 是 人 的 视觉 所 不 易 察 觉 到 的 。 经 过 采样 后 的 图 像 数 据 , 色 度数 据 比 原来 减少 了 一 半 。 

2. 数据 分 块 

对 图 像 进行 编码 前 ,将 每 个 分 量 图 像 分 割 成 不 重 释 的 图 像 子 块 , 对 于 JPEG 标准 的 
DCT 变换 应 选择 分 为 8X8 像素 子 块 ,每 一 个 8X8 像素 子 块 称 为 一 个 数据 单元 。 

3. DCT 变换 

图 像 数据 块 分 割 为 8X8 子 块 之 后 . 即 以 8X8 子 块 为 单位 顺序 进行 二 维 DCT 变换 。 对 
以 无 符号 数 表示 的 具有 p 位 (一 般 用 8 位 表示 一 个 像素 的 颜色 分 量 ) 精 度 的 输入 数据 ,在 
DCT 前 要 减 去 2 所 : ,转换 成 有 符号 数 , 即 在 [0,22'] 范 围 内 表示 的 无 符号 整数 变 成 [一 2 入 ， 
2 和 :一 1) 范 围 内 表示 的 有 符号 数 ,作为 IDCT 变换 的 输入 量 。 在 IDCT 后 应 加 上 2*7! ,转换 
成 无 符号 数 。 对 每 个 8X8 的 数据 块 进行 DCT 变换 后 ,所 获得 64 个 变换 系数 代表 了 该 图 像 
子 块 的 频率 成 分 ,其 中 低频 分 量 集 中 在 左上 角 ,高 频 分 量 分 布 在 右 下 角 。 系 数 和 矩阵 左上 和 角 的 
系数 称 为 直流 (DC) 系 数 , 它 代表 了 该 数据 块 的 平均 值 , 其 余 63 个 系数 为 交流 (AC) 系 数 。 

4. 系数 量化 

系数 量化 的 目的 是 在 保证 图 像 质 量 的 前 提 下 ,丢掉 那些 对 视觉 影响 不 大 的 信息 。 在 
DCT 变换 所 得 到 的 64 个 系数 中 ,低频 分 量 主要 包含 图 像 亮度 等 信息 。 在 从 空间 域 到 频 域 
的 变换 中 ,图像 中 的 缓慢 变化 比 快速 变化 更 易 引 起 视觉 效果 ,所 以 在 重建 图 像 时 ,低频 分 量 
的 重要 性 高 于 高 频 分 量 。 因 而 在 编码 时 可 以 忽略 高 频 分 量 ,从 而 达到 压缩 数据 的 目的 。 

JPEG 标准 采用 具有 64 个 独立 元 素 的 量化 表 来 实现 DCT 相应 的 64 个 系数 的 量化 精 
度 ,使 得 对 某 个 系数 的 具体 量化 与 人 类 视觉 对 该 频率 分 量 的 视觉 敏感 程度 一 致 。 理 论 上 ,对 
不 同 的 空间 分 辩 率 、 数 据 精度 等 情况 ,应 该 有 不 同 的 量化 表 。 但 一 般 采 用 图 9-11(a) 对 Y 分 
量 进行 量化 ,而 采用 图 9-11(b) 对 色 度 分 量 进行 量化 ,可 取得 较 好 的 视觉 效果 。 两 张 量 化 表 
充分 考虑 了 了 分 量 比 C, 和 C, 更 重要 等 因素 , 即 对 Y 采 用 细 量 化 ,而 对 C, 和 C, 采用 粗 量 
化 。 即 以 DCT 变换 后 的 系数 除 以 量化 表 中 相对 应 的 量化 参数 ,然后 以 四 舍 五 入 的 方式 取 
整 ,量化 公式 为 


F(u,v) 
Q(u,v) 

式 中 ,F, (uv) 表示 量化 以 后 的 DCT 系数 ; F(u,v) 表 示 直 接 经 DCT 变换 后 的 系数 ; 
Q(u,v) 表 示 图 9-11 中 的 量化 参数 。 


F, (uv) = IntegerRound[ (9-30) 


16 |11|10|16 |24 |40 |51 |61 17 | 18 |24|47|99|99|99 |99 
12 | 12 | 14 | 19 |26 |58 | 69 | 55 18 | 21 | 26 | 66 | 9%9 | 9%9 | 9% | 99 
14 | 13 | 16 | 24 |40 |57 | 69 | 56 24 | 26 | 56 | 99 | 9%9 | 9%9 | 99 | 99 
14 | 17 | 22 | 29 |51 |87 | 80 | 62 47 | 66 | 99 | 99 | 99 | 99 | 99 | 99 
18 | 22 | 37 | 56 |68 |109|103| 77 久 1 稚 | 上航 | 息 | 男 | 纹 | 史 | 交 
24 |35 | 55 | 64 |81 |104| 113| 92 交 | 99 | 的 | 允 | 鸡 | 鸡 | 双 | 名 
49 | 64 |78 | 87 |103|121|120| 101 99 | 99 | 99 | 99 |99|9|9|99 
79 | 92 | 95 | 98 | 112 | 100 | 103 | 99 | 的 | 鸡 | 允 | 又 | 区 | 和 91 入 


(a) 亮度 量化 表 (b) 色 度量 化 表 
图 9-11 亮度 与 色 度量 化 表 


到 
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5. Z 形 扫描 
DCT 系数 量化 后 ,构成 一 个 稀疏 和 矩阵 ,用 Z(Zigzag) 形 扫描 将 其 变 成 一 维 数列 ,将 有 利 
于 焙 编 码 。Z 形 扫描 的 顺序 如 图 9-12 所 示 。 


图 9-12 AC 系数 的 Z 形 扫描 表 


6. DC 系数 编码 

DCT 变换 产生 的 64 个 系数 经 过 量化 后 ,其 中 F(0,0) 为 直流 系数 DC, 其 余 的 63 个 为 
交流 系数 AC,DC 系数 的 大 小 反映 了 一 个 8X8 数据 块 的 平均 亮度 。 由 于 8X8 的 相 邻 子 块 
之 间 DC 系数 有 很 强 的 相关 性 ,所 以 JPEG 对 DC 系数 采用 差分 编码 , 即 以 前 一 数据 块 的 同 
一 分 量 的 DC 系数 作为 当前 块 的 预测 值 ,再 对 当前 块 的 实际 值 与 预测 值 的 差 值 (DC; 一 
DC;-1) 进 行 瞧 夫 曼 编码 或 算术 编码 。 

若 DC 系数 的 动态 范围 为 一 1024 一 1024, 则 差 值 的 动态 范围 可 达 一 2047 一 十 2047, 由 于 
差分 值 范围 太 大 ,JPEG 没有 采用 对 每 一 个 差分 值 赋 予 一 个 码 字 ,而 是 对 码 表 进 行 了 简化 ， 
采用 “前 织 码 (SSSS) 十 尾 码 表示。 前缀 码 指 明了 尾 码 的 有 效 位 数 B, 可 以 根据 差分 值 从 
表 9-11 中 查 出 前 级 码 对 应 的 霍 夫 曼 编码 。 尾 码 的 取 值 取决 于 DC 系数 的 差 值 和 前 缀 码 。 
如 果 DC 系数 的 差分 值 (D) 大 于 等 于 0, 则 尾 码 的 码 字 为 差分 值 的 原 码 ; 否则 , 取 差 分 值 的 
B 位 反 码 。DC 系数 编码 的 具体 步骤 如 下 : 

(1) 对 差分 值 进 行 判 断 , 如 果 差 分 值 大 于 0 ,将 差分 值 转换 为 二 进 制 表示 ,并 获得 差 值 所 
占 的 位 数 。 例 如 差 值 为 5 时 ,其 二 进 制 表示 为 101 ,差分 值 的 位 数 为 3。 如 果 差 分 值 小 于 0， 
则 取 绝 对 值 后 转换 为 二 进 制 码 表示 ,再 获得 该 编码 值 的 反 码 。 例 如 差 值 为 一 5 时 ,最 后 得 反 
码 为 010, 差 分 值 的 位 数 为 3。 

(2) 根据 “前 缀 码 (SSSS) 十 尾 码 ” 的 表示 方法 ,以 差分 值 所 占 的 位 数 为 索引 值 查 表 获 得 
该 差分 值 的 编码 。 表 9-11 所 示 为 亮度 系数 (DC) 的 霍 夫 曼 编码 表 。 查 表 可 获得 差分 值 为 5 
时 编码 为 100, 因 此 ,结合 前 级 码 (SSSS) 和 尾 码 , 最 终 的 编码 值 为 100101 ,而 差 值 为 一 5 时 的 
最 终 编 码 为 100010。 表 9-11 表明 ,DC 系数 差分 值 的 最 大 位 数 为 11 位 , 即 最 大 差 值 在 
(一 2 ,24 一 1) 范 围 内 。 
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表 9-11 DC 系数 差分 值 替 夫 曼 编码 转换 表 


SSSS DC 系数 差 值 (D) 亮度 码 字 色 度 码 字 
0 0 00 00 
1 —lLl 010 01 
并 i224 011 10 
3 一 7 一 一 494 一 7 100 110 
4 一 15 一 一 8;8 一 15 101 1110 
5 一 到 一 一 16516~31 110 11110 
6 一 03 一 一 17517 一 63 1110 111110 
部 一 所 7 一 一 64564~ 127 11110 1111110 
8 一 255 一 一 128,128 一 255 111110 11111110 
9 一 511 一 一 256,256 一 511 1111110 111111110 
10 一 1023 一 一 512,512 一 1023 11111110 1111111110 
11 一 2047 一 一 1023 ,1023 一 2047 111111110 11111111110 
7. AC 系数 编码 


JPEG 基本 系统 对 63 个 交流 系数 AC 则 采用 行程 长 度 编码 ,采用 Z 字形 扫描 是 为 了 增 
加 0 的 行程 长 度 , 从 而 更 有 利于 压缩 数据 。 交 流 系 数 AC 的 编码 也 可 采用 霍 夫 曼 编码 或 算 
术 编 码 。JPEG 在 对 AC 系数 进行 Z 行程 长 度 编码 后 ,将 一 个 非 零 AC 系数 及 其 前 面 的 0 行 
程 长 度 称 为 一 个 组 合 , 记 为 [NNNN/SSSS], 将 每 个 组 合 以 “[NNNN/SSSS] 十 尾 码 ” 进 行 编 
码 表示 ,其 中 ,NNNN 为 0 行程 的 长 度 ,SSSS 表示 尾 码 的 有 效 位 数 , 即 当前 非 0 系数 所 占 的 
比特 数 ,如 果 非 零 AC 系数 大 于 等 于 0, 则 尾 码 的 码 字 为 该 系数 的 原 码 , 若 AC 系数 小 于 0， 
则 以 该 系数 绝对 值 的 反 码 表示 。 

由 于 JPEG 以 4 位 表示 0 的 行程 长 度 , 故 在 JPEG 编码 中 ,0 的 最 大 行程 只 能 等 于 15。 
当 0 的 行程 长 度 大 于 15 时 ,需要 将 其 分 开 进行 多 次 编码 , 即 对 前 面 的 每 16 个 0 以 “F/0” 表 
示 , 对 剩余 0 行程 继续 编码 。 

根据 非 零 系数 的 数值 可 从 表 9-12 查 出 对 应 的 SSSS ,然后 根据 NNNN/SSSS 从 表 9-13 
中 查 得 其 对 应 的 霍 夫 曼 编码 。 表 9-13 所 示 是 ITU-T 亮度 AC 系数 的 霍 夫 曼 编码 表 , 从 
表 9-13 可 以 看 出 ,亮度 AC 系数 差 值 的 最 大 位 数 为 10 位 , 即 最 大 差分 值 在 [一 2”,2” 一 1] 
范围 之 内 。 

表 9-12 AC 系数 的 霍 夫 曼 尾 码 位 数 表 


AC 系数 的 幅度 
0 
一 1,1 
一 3, 一 2,2,3 
— 
一 15 一 一 8,8 一 15 
一 31 一 一 16,16 一 31 
一 63 一 一 17,17 一 63 
一 127 一 一 64,64 一 127 
一 255 一 一 128,128 一 255 
一 511 一 一 256,256 一 511 
一 1023 一 一 512,512 一 1023 
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表 9-13 亮度 AC 的 霍 夫 曼 编码 表 
亮度 AC 系数 色 度 AC 系数 
游程 /尺寸 
码 长 码 字 码 长 码 字 
0/0(EOB) 4 1010 2 00 

0/1 2 00 2 01 
0/2 2 01 3 100 
0/3 3 100 4 1010 
0/4 4 1011 5 11000 
0/5 5 11010 5 11001 
0/6 7 1111000 6 111000 
0/7 8 11111000 + 1111000 
0/8 10 1111110110 9 111110100 
0/9 16 1111111110000010 10 1111110110 
0/A 16 1111111110000011 12 111111110100 
1/1 4 1100 4 1011 
1/2 5 11011 6 111001 
1/3 7 1111001 8 11110110 
1/4 9 111110110 9 111110101 
1/5 如 11111110110 WL 11111110110 
1/6 16 1111111110000100 12 111111110101 
1/7 16 1111111110000101 16 1111111110001000 
1/8 16 1111111110000110 16 1111111110001001 
1/9 16 1111111110000111 16 1111111110001010 
1/A 16 1111111110001000 16 1111111110001011 
2/1 5 11100 5 11010 
2/2 8 11111001 8 11110111 
2/3 10 1111110111 10 1111110111 
2/4 12 111111110100 12 111111110110 
2/5 16 1111111110001001 15 111111111000010 
2/6 16 1111111110001010 16 1111111110001100 
2 16 1111111110001011 16 1111111110001110 
2/8 16 1111111110001100 16 1111111110001110 
2/9 16 1111111110001101 16 1111111110001111 
2/A 16 1111111110001110 16 1111111110010000 
3/1 6 111010 5 11011 
3/2 9 111110111 8 11111000 
3/3 下 111111110101 10 1111111000 
3/4 16 1111111110001111 12 111111110111 
3/5 16 1111111110010000 16 1111111110010001 
3/6 16 1111111110010001 16 1111111110010010 
3/7 16 1111111110010010 16 1111111110010011 
3/8 16 1111111110010011 16 1111111110010100 
3/9 16 1111111110010100 16 1111111110010101 
3/A 16 1111111110010101 16 1111111110010110 
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续 表 
亮度 AC 系数 色 度 AC 系数 
游程 /尺寸 

码 长 码 字 码 长 码 字 
4/1 6 111011 6 111010 
4/2 10 1111111000 9 111110110 
4/3 16 1111111110010110 16 1111111110010111 
4/4 16 1111111110010111 16 1111111110011000 
4/5 16 1111111110011000 16 1111111110011001 
4/6 16 1111111110011001 16 1111111110011010 
4/7 16 1111111110011010 16 1111111110011011 
4/8 16 1111111110011011 16 1111111110011100 
4/9 16 1111111110011100 16 1111111110011101 
4/A 16 1111111110011101 16 1111111110011110 
5/1 7 1111010 6 111011 
5/2 还 11111110111 10 1111111001 
5/3 16 1111111110011110 16 1111111110011111 
5/4 16 1111111110011111 16 1111111110100000 
5/5 16 1111111110100000 16 1111111110100001 
5/6 16 1111111110100001 16 1111111110100010 
5/7 16 1111111110100010 16 1111111110100011 
5/8 16 1111111110100011 16 1111111110100100 
5/9 16 1111111110100100 16 1111111110100101 
5/A 16 1111111110100101 16 1111111110100110 
6/1 7 1111011 1111001 
6/2 12 111111110110 1 11111110111 
6/3 16 1111111110100110 16 1111111110100111 
6/4 16 1111111110100111 16 1111111110101000 
6/5 16 1111111110101000 16 1111111110101001 
6/6 16 1111111110101001 16 1111111110101010 
6/7 16 1111111110101010 16 1111111110101011 
6/8 16 1111111110101011 16 1111111110101100 
6/9 16 1111111110101100 16 1111111110101101 
6/A 16 1111111110101101 16 1111111110101110 
7/1 8 111110101 x 1111010 
7/2 区 111111110111 11 11111111000 
到 8 16 1111111110101110 16 1111111110101111 
7/4 16 1111111110101111 16 1111111110110000 
7/5 16 1111111110110000 16 1111111110110001 
7/6 16 1111111110110001 16 1111111110110010 
8 16 1111111110110010 16 1111111110110011 
7/8 16 1111111110110011 16 1111111110110100 
7/9 16 1111111110110100 16 1111111110110101 
7/A 16 1111111110110101 16 1111111110110110 
8/1 9 111111000 8 11111001 
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续 表 
亮度 AC 系数 色 度 AC 系数 
游程 /尺寸 
码 长 码 字 码 长 码 字 

8/2 15 111111111000000 16 1111111110110111 
8/3 16 1111111110110110 16 1111111110111000 
8/4 16 1111111110110111 16 1111111110111001 
8/5 16 1111111110111000 16 1111111110111010 
8/6 16 1111111110111001 16 1111111110111011 
8/7 16 1111111110111010 16 1111111110111100 
8/8 16 1111111110111011 16 1111111110111101 
8/9 16 1111111110111100 16 1111111110111110 
8/A 16 1111111110111101 16 1111111110111111 
9/1 9 111111001 9 111110111 

9/2 16 1111111110111110 16 1111111111000000 
9/3 16 1111111110111111 16 1111111111000001 
9/4 16 1111111111000000 16 1111111111000010 
9/5 16 1111111111000001 16 1111111111000011 
9/6 16 1111111111000010 16 1111111111000100 
9/7 16 1111111111000011 16 1111111111000101 
9/8 16 1111111111000100 16 1111111111000110 
9/9 16 1111111111000101 16 1111111111000111 
9/A 16 1111111111000110 16 1111111111001000 
A/1 9 111111010 9 111111000 

A/2 16 1111111111000111 16 1111111111001001 
A/3 16 1111111111001000 16 1111111111001010 
A/4 16 1111111111001001 16 1111111111001011 
A/5 16 1111111111001010 16 1111111111001100 
A/6 16 1111111111001011 16 1111111111001101 
A/7 16 1111111111001100 16 1111111111001110 
A/8 16 1111111111001101 16 1111111111001111 
A/9 16 1111111111001110 16 1111111111010000 
A/A 16 1111111111001111 16 1111111111010001 
B/1 10 1111111001 9 111111001 

B/2 16 1111111111010000 16 1111111111010010 
B/3 16 1111111111010001 16 1111111111010011 
B/4 16 1111111111010010 16 1111111111010100 
B/5 16 1111111111010011 16 1111111111010101 
B/6 16 1111111111010100 16 1111111111010110 
B/7 16 1111111111010101 16 1111111111010111 
B/8 16 1111111111010110 16 1111111111011000 
B/9 16 1111111111010111 16 1111111111011001 
B/A 16 1111111111011000 16 1111111111011010 
BA 10 1111111010 9 111111010 

C2 16 1111111111011001 16 1111111111011011 
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续 表 
亮度 AC 系数 色 度 AC 系数 
游程 /尺寸 

码 长 码 字 码 长 码 字 
C/3 16 1111111111011010 16 1111111111011100 
C/4 16 1111111111011011 16 1111111111011101 
C/5 16 1111111111011100 16 1111111111011110 
C/6 16 11111111110U101 16 1111111111011111 
C/7 16 1111111111011110 16 1111111111100000 
C/8 16 1111111111011111 16 1111111111100001 
C/9 16 1111111111100000 16 1111111111100010 
C/A 16 1111111111100001 16 1111111111100011 
D/1 11 11111111000 坡 11111111001 
D/2 16 1111111111100010 16 1111111111100100 
D/3 16 1111111111100011 16 1111111111100101 
D/4 16 1111111111100100 16 1111111111100110 
D/5 16 1111111111100101 16 1111111111100111 
D/6 16 1111111111100110 16 1111111111101000 
D/7 16 1111111111100111 16 1111111111101001 
D/8 16 1111111111101000 16 1111111111101010 
D/9 16 1111111111101001 16 1111111111101011 
D/A 16 1111111111101010 16 1111111111101100 
E/1 16 1111111111101011 14 11111111100000 
E/2 16 1111111111101100 16 1111111111101101 
E/3 16 1111111111101101 16 1111111111101110 
E/4 16 1111111111101110 16 1111111111101111 
E/5 16 1111111111101111 16 1111111111110000 
E/6 16 1111111111110000 16 1111111111110001 
E/7 16 1111111111110001 16 1111111111110010 
E/8 16 1111111111110010 16 1111111111110011 
E/9 16 1111111111110011 16 1111111111110100 
E/A 16 1111111111110100 16 1111111111110101 
F/0 11 11111111001 10 1111111010 
F/1 16 1111111111110101 15 111111111000011 
F/2 16 1111111111110110 16 1111111111110100 
F/3 16 1111111111110111 16 1111111111110111 
F/4 16 1111111111111000 16 1111111111111000 
F/5 16 1111111111111001 16 1111111111111001 
F/6 16 1111111111111010 16 1111111111111010 
F/7 16 1111111111111011 16 1111111111111011 
F/8 16 1111111111111100 16 1111111111111100 
F/9 16 1111111111111101 16 1111111111111101 
F/A 16 1111111111111110 16 1111111111111110 
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9.7.3 渐进 式 DCT 方式 编码 


基于 DCT 的 顺序 模式 编码 是 对 每 一 幅 图 像 子 块 (8X8 子 块 ) 按 从 左 到 右 .从 上 到 下 的 
顺序 一 次 扫描 完成 编码 ,而 渐进 式 DCT 方式 编码 模式 是 对 每 一 幅 图 像 子 块 的 编码 要 经 过 
若干 次 扫描 才能 完成 。 第 一 次 只 进行 较 粗糙 的 图 像 扫描 压缩 ,并 以 相对 于 总 的 传输 时 间 快 
得 多 的 时 间 传 输 粗 糙 图 像 ,重建 质 量 较 低 的 可 识别 图 像 。 在 随后 的 扫描 中 再 对 图 像 进行 较 
细 的 压缩 , 且 仅 传 递 新 增加 的 信息 ,重建 一 幅 质 量 提高 的 图 像 ,这 样 不 断 累进 ,直到 获得 满意 
的 图 像 为 止 。 累 进 的 方式 可 采用 频谱 选择 法 或 按 位 逼近 法 。 

1. 频谱 选择 法 

在 每 一 次 扫描 中 ,只 对 DCT 的 64 个 变换 系数 中 的 某 些 频 带 的 系数 进行 编码 、 传 递 ,而 
其 他 频带 的 系数 编码 与 传递 在 随后 的 扫描 中 进行 ,直到 全 部 DCT 系数 处 理 完毕 为 止 。 

2. 按 位 逼近 法 

按 DCT 量化 系数 的 有 效 位 方向 , 即 表 示 系 数 精度 的 位 数 方向 分 段 渐 进 编码 。 第 一 次 
扫描 只 取 最 高 有 效 位 的 位 编码 和 传递 ,然后 再 对 其 余 位 进行 编码 和 传递 。 


9.7.4 JPEG 2000 


JPEG 2000 标准 是 JPEG 工作 组 于 2000 年 年 底 正 式 公布 的 JPEG 最 新 静止 图 像 压 缩 
编码 的 国际 标准 ,标准 号 为 ISO/IEC 15444(ITU-TT. 800) 。 

在 JPEG 2000 颁布 之 前 ,JPEG 标准 的 基本 系统 已 经 在 静止 图 像 数据 压缩 方面 得 到 了 
非常 广泛 的 应 用 ,在 JPEG 标准 获得 巨大 成 功 的 同时 ,该 标准 存在 的 一 些 缺 点 和 不 足 也 开始 
显现 出 来 ,主要 表现 在 医学 图 像 、 多 媒体 .数字 图 书馆 、Internet 和 移动 网 络 等 某 些 应 用 方 
面 ,尽管 JPEG 扩展 系统 致力 于 解决 上 述 问题 ,但 仅仅 是 在 非常 有 限 的 范围 之 内 发 挥 作用 ， 
并 且 扩 展 系统 有 时 还 因为 知识 产权 和 专利 等 方面 的 原因 使 应 用 受到 限制 。 因 此 ,JPEG 工 
作 组 于 1996 年 开始 致力 于 研究 一 种 新 的 静止 图 像 压 缩编 码 标准 ,这 就 是 后 来 正式 定名 为 
JPEG 2000 的 国际 标准 。 

为 了 能 够 用 单一 的 压缩 码 流 提供 多 种 性 能 ,满足 更 为 广泛 的 应 用 ,并 考虑 到 JPEG 标准 
已 经 广泛 使 用 的 现状 ,JPEG 2000 主要 由 6 个 部 分 组 成 。 第 1 部 分 为 编码 的 核心 部 分 ,是 公 
开 并 可 免费 使 用 的 , 它 具 有 最 小 的 复杂 性 却 可 以 满足 80% 以 上 的 图 像 压缩 应 用 需求 ,其 地 
位 相当 于 JPEG 标准 的 基本 系统 。 第 2 一 6 部 分 则 定义 了 压缩 技术 和 文件 格式 的 扩展 部 分 。 
其 中 ,第 2 部 分 为 编码 扩展 ,第 3 部 分 为 Motion JPEG 2000( 即 MJP2) ,第 4 部 分 为 一 致 性 
测试 ,第 5 部 分 为 参考 软件 ,第 6 部 分 是 关于 混合 图 像 文件 格式 方面 的 内 容 和 方法 。 

图 9-13 所 示 是 采用 了 以 上 新 技术 的 JPEG 2000 的 基本 模块 组 成 ,其 中 包括 预 处 理 、 
DWT. 量 化 、 自 适应 算术 编码 以 及 码 流 组 织 等 多 个 模块 。 

均匀 量化 


原始 图 像 数据 | | 数据 预 处 理 | 一 |DWT 变 换 一 | (4 风光 区 仿 ) 


t 


图 像 编码 数据 


码 流 组 织 | 一 自 适 应 算术 编码 


图 9-13 JPEG 2000 的 基本 模块 组 成 
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需要 强调 的 是 ,JPEG 工作 组 在 探索 和 研究 静止 图 像 压 缩 的 新 标准 时 提出 ,JPEG 2000 
不 仅 应 提供 比 JPEG 基本 系统 更 高 的 压缩 性 能 ,而 且 应 具有 一 种 关于 图 像 新 的 描述 方法 ,可 
以 采用 单一 码 流 提供 适应 多 种 应 用 的 性 能 。 以 能 满足 绝 大 多 数 图 像 压 缩 应 用 的 JPEG 2000 
基本 系统 为 例 ,JPEG 工作 组 主要 在 以 下 9 个 有 代表 性 的 方面 提出 了 改进 要 求 。 

(1) 更 高 的 图 像 数 据 压缩 比 。 

(2) 同时 支持 有 失真 和 无 失真 数据 压缩 。 

(3) 很 强 的 抗 误 码 能 力 。 

(4) 支持 多 分 辨 率 。 

(5) 对 多 重 压缩 /解压 缩 循环 性 能 进行 改进 。 

(6) 租 入 式 码 流 (逐渐 显示 解码 和 SNR 可 分 级 ) 。 

(7) 码 流 的 随机 存 取 和 处 理 。 

(8) 共和 置 (tiling)。 

(9) 更 灵活 的 文件 格式 。 

为 了 满足 新 的 性 能 标准 和 应 用 需求 ,JPEG 2000 采用 了 许多 新 的 图 像 压缩 编码 技术 ,对 
包括 压缩 比 \ 压 缩 算法 和 失真 性 等 数据 压缩 技术 的 重要 指标 方面 进行 了 重新 考虑 。 

(1) JPEG 2000 系统 中 ,以 全 帧 离散 小 波 变换 (DWT) 取 代 了 JPEG 基本 系统 基于 图 像 
子 块 的 DCT 变换 ,DWT 变换 继承 了 小 波 变 换 的 多 分 辩 率 性 能 ,可 以 实现 对 图 像 的 多 分 辩 
率 表 示 , 与 人 类 的 视觉 特性 非常 吻合 。 此 外 ,DWT 可 以 在 大 范围 消除 图 像 数 据 的 相关 性 ， 
更 有 效 地 集中 图 像 能 量 ,改善 图 像 数 据 的 分 布 ,使 数据 压缩 效率 得 到 进一步 提高 。 

(2) JPEG 2000 系统 采用 了 一 种 具有 中 央 * 死 区 ?功能 的 均匀 量化 器 实现 嵌入 式 编码 方 
法 。 对 于 量化 系数 ,各 比特 面 采用 基于 上 下 文 的 自 适应 算术 编码 方式 ,这 些 由 比特 面 提供 的 
捞 入 式 码 流 同时 也 提供 了 SNR 的 可 分 级 性 ; 而且 每 个 子 带 的 比特 面 被 限制 在 独立 的 矩形 
块 中 通过 3 次 扫描 完成 编码 ,由 此 得 到 最 佳 的 嵌入 式 码 流 , 更 高 的 抗 误 码 能 力 、 部 分 空间 随 
机 存 取 与 处 理 能 力 ,实现 了 非常 灵活 的 码 流 语法 。 

(3) JPEG 2000 系统 使 用 了 整 系数 DWT 滤波 器 ,在 单一 码 流 中 可 以 同时 实现 有 失真 
和 无 失真 图 像 数 据 压缩 。 


9.7.5 JPEG 编码 实例 


例 9-7: JPEG 编码 举例 
设 一 幅 图 像 的 8X8 图 像 子 块 的 亮度 数据 如 图 9-14 所 示 , 试 对 该 子 块 按 JPEG 标准 的 


基本 系统 进行 编码 。 
97 94 90 84 78 76 67 51 
96 93 89 83 各 | 75 66 50 
95 92 88 81 76 74 64 49 
93 90 87 80 74 72 63 47 
91 88 84 78 外 70 61 45 
89 86 82 75 70 68 58 43 
86 83 80 73 67 66 56 40 
84 81 77 70 65 63 53 38 


图 9-14 原始 图 像 8X8 子 块 亮度 数据 
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根据 JPEG 编码 原理 ,基本 系统 编码 过 程 的 主要 步 又 如 下 : 
(1) 对 原始 图 像 8X8 子 块 的 亮度 数据 进行 DCT 变换 ,结果 如 图 9-15 所 示 。 
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图 9-15 原始 图 像 8X8 子 块 DCT 系数 表 


(2) DCT 变换 以 后 ,用 图 9-11(a) 所 示 的 亮度 量化 表 对 如 图 9-15 所 示 的 DCT 系数 矩阵 
进行 量化 ,结果 如 图 9-16 所 示 。 
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图 9-16 DCT 系数 量化 结果 


(3) 对 量化 结果 表 按 规定 顺序 进行 Z 形 扫描 ,并 对 图 9-16 中 的 一 个 DC 及 5 个 非 零 AC 
系数 进行 编码 。 

(4) DC 系数 编码 ,Z 形 扫描 结果 的 第 一 个 系数 为 DC 系数 。 假 设 前 一 亮度 数据 块 的 
DC 系数 为 17, 则 差分 值 为 20(37 一 17) , 查 表 9-11 得 SSSS 为 3, 其 前 级 码 字 为 110, 尾 码 即 
为 20 的 5 位 二 进 制 原 码 10100, 从 而 DC 系数 的 编码 为 11010100。 

(5) AC 系数 编码 

@D 在 图 9-16 中 , 按 Z 形 顺序 扫描 ,第 1 个 非 零 AC 系数 为 10, 该 系数 之 前 的 0 的 连续 
个 数 为 0, 即 NNNN=0, 根 据 系数 10, 查 表 9-12 得 ,SSSS 二 4, 因 此 ,NNNN/SSSS 二 0/4, 查 
表 9-13 得 霍 夫 曼 编码 为 1011, 加 上 10 的 二 进 制 编码 为 1010, 由 此 可 得 AC 系数 10 的 编码 
为 10111010。 

@ 第 2 个 非 零 AC 系数 为 3, 该 系数 之 前 的 0 的 连续 个 数 为 0, 即 NNNN 王 0, 根 据 系数 
3, 查 表 9-12 得 , SSSS 二 2, 因此, NNNN/SSSS 二 0/2, 查 表 9-13 得 霍 夫 曼 编码 为 01, 加 上 
3 的 二 进 制 编码 为 11, 由 此 可 得 AC 系数 3 的 编码 为 0111。 

@ 第 3 个 非 零 AC 系数 为 一 2 ,该 系数 之 前 的 0 的 连续 个 数 为 2, 即 NNNN 一 2, 根据 系 
数 一 2, 查 表 9-12 得 ,SSSS=2, 因 此 ,NNNN/SSSS = 2/2, 查 表 9-13 得 霍 夫 曼 编 码 为 
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11111001, 加 上 一 2 的 绝对 值 之 二 进 制 编 码 为 10, 其 反 码 为 01, 由 此 可 得 AC 系数 一 2 的 编 
码 为 1111100101 。 

@ 第 4 个 非 零 AC 系数 为 2, 该 系数 之 前 的 0 的 连续 个 数 为 0, 即 NNNN==0, 根 据 系数 
2 , 查 表 9-12 得 ,SSSS 二 2, 因 此 , NNNN/SSSS 二 0/2, 查 表 9-13 得 霍 夫 曼 编码 为 01, 加 上 
2 的 二 进 制 编码 为 10, 由 此 可 得 AC 系数 2 的 编码 为 0110。 

@ 第 5 个 非 零 AC 系数 为 一 1, 该 系数 之 前 的 0 的 连续 个 数 为 7, 即 NNNN==7, 根 据 系 
数 一 1, 查 表 9-12 得 ,SSSS=1, 因 此 ,NNNN/SSSS = 7/1, 查 表 9-13 得 堆 夫 曼 编码 为 
1111010, 加 上 一 1 的 绝对 值 之 二 进 制 编码 为 1, 其 反 码 为 0, 由 此 可 得 AC 系数 1 的 编码 
为 11110100。 

@ 由 于 其 他 AC 系数 全 为 0, 直 接 以 结束 块 “EOB(0/0)” 结 束 8X8 子 块 的 编码 , 查 表 9-13 
得 编码 为 1010。 因 此 ,可 得 该 8X8 子 块 的 全 部 编码 为 


1101010010111010011111111001010110111101010010 


共有 46 位 编码 ,而 原始 图 像 子 抉 需要 8X8X8 一 512 位 ,由 此 可 得 压缩 比 为 11 : 1。 
9.8 MPEG 标准 


MPEG 是 ISO 运动 图 像 专家 小 组 的 英文 缩写 ,该 组 织 专门 致力 于 对 运动 图 像 压 缩编 码 
技术 的 标准 化 与 应 用 研究 。 该 小 组 于 1991 年 年 底 提 出 了 用 于 数字 存储 媒介 速率 约 1. 5MB/s 
的 运动 图 像 与 伴音 的 压缩 、 解 压缩 及 编码 的 国际 标准 ,并 于 1992 年 正式 通过 ,通常 被 称 为 
MPEG-1 标准 , 即 ISO/IEC11172。 

目前 标准 不 是 一 个 单一 的 标准 ,而 是 一 个 用 于 全 运动 视频 和 相关 音频 压缩 的 标准 系列 , 包 
括 MPEG-1、MPEG-2、.MPEG-4、MPEG-7、MPEG-21 等 多 个 标准 (MPEG-3 不 常用 ), 如 表 9-14 
所 示 , 每 一 个 MPEG 标准 都 有 其 特定 的 应 用 范围 。 其 中 , MPEG-1、MPEG-2、MPEG-4 标准 的 
应 用 范围 最 广 。MPEG 标准 的 视频 压缩 编码 技术 主要 利用 了 具有 运动 补偿 的 帧 间 压 缩编 码 技 
术 以 减 小 时 间 宛 余 度 ,利用 DCT 技术 以 减 小 图 像 的 空间 元 余 度 ,利用 入 编 码 则 在 信息 表示 方 
面 减 小 了 统计 完 余 度 。 这 几 种 技术 的 综合 运用 ,大 大 增强 了 压缩 性 能 。 


表 9-14 MPEG 标准 


标 准 号 应 用 范 数 据 率 
MPEG-1 320X240 广播 级 全 运动 图 像 1. 5Mb/s 标准 TV 质量 输出 
MPEG-2 720X480 广播 级 全 运动 图 像 4~10Mb/sVCR 质量 输出 
MPEG-4 适用 于 罕 带 视频 电话 和 具有 低 分 辩 率 小 幅 图 像 9 一 40kb/s 视频 电话 图 像 输出 


9.8.1 MPEG-1 


MPEG-1 主要 包括 系统 、 视 频 、. 音 频 、 一 致 性 参考 软件 5 部 分 。 其 目的 是 满足 对 各 种 存 
储 媒体 上 压缩 视频 统一 表示 格式 的 需要 ,可 用 于 625 线 和 525 线 电视 系统 ,对 传输 速率 约 
1. 5Mb/s 的 存储 媒体 提供 连续 、 活 动 图 像 的 编码 表示 (如 VCD、DAT 以 及 计算 机 磁盘 等 )， 
但 因 采 用 的 方法 是 通用 的 ,因此 可 用 于 更 广泛 的 范围 。 
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1. 图 像 格式 与 约束 参数 

MPEG-1 处 理 的 对 象 是 逐 行 扫描 的 图 像 , 对 于 交织 的 图 像 源 ,编码 前 必须 先 转换 为 非 交 
织 格式 ; 输入 信号 (视频 信号 ) 必 须 是 数字 化 的 YC,C; 信号 ,数据 经 过 预 处 理 和 格式 转换 后 
选择 一 个 合适 的 窗口 ,分 状 率 和 输入 格式 ,要 求 色差 信号 和 亮度 信号 在 垂直 与 水 平方 向 按 
2 : 1 进行 抽样 。 

由 于 MPEG-1 可 表示 的 比特 流 的 特性 范围 很 大 ,因此 定义 了 一 个 如 表 9-15 所 示 的 约束 参 
数 编码 参数 子 集 , 并 用 比特 流 中 的 一 个 标志 位 进行 标识 。 当 码 率 为 1 一 1. 5Mb/s 时 ,图 像 速率 
的 合理 选择 是 每 秒 24、25 或 30 幅 ,水 平分 辨 率 在 250 一 400 像素 ,垂直 分 辩 率 在 200 一 300 线 。 


表 9-15 约束 参数 表 


项 目 指 标 

图 像 宽度 二 768 个 像素 

图 像 高 度 三 576 线 

图 像 范围 委 396 个 宏 块 

像素 速率 过 396X25 宏 块 / 秒 
2. 算法 及 编 解码 


MPEG 编码 技术 的 选择 是 基于 高 质量 的 连续 活动 图 像 .高 压缩 比 以 及 对 编码 比特 流 的 
随机 操作 需求 之 间 的 平衡 。 运动 图 像 的 压缩 包括 帧 内 压缩 与 帧 间 压 缩 两 个 主要 方面 。 帧 内 
压缩 是 删除 基于 空间 的 数据 宛 余 , 帧 间 压 缩 则 是 删除 基于 帧 与 帧 之 间 的 时 间 宛 余 。MPEG 
标准 在 空间 域 的 压缩 ,吸收 了 JPEG 的 一 些 要 点 ,将 每 一 帧 作为 独立 的 图 像 获 取 , 其 压缩 步 
又 与 JPEG 标准 基本 一 致 。 而 运动 图 像 相 邻 帧 之 间 ( 视 频 图 像 信号 ) 具 有 非常 大 的 相关 人 性， 
即 存在 很 大 的 时 间 元 余 ,多 数 情况 下 ,从 一 帧 到 下 一 帧 变化 的 只 是 一 小 部 分 ,而 画面 中 的 绝 
大 部 分 相同 。 运 动 图 像 时 间 元 余 的 删除 是 通过 帧 间 编 码 完成 的 。 

帧 间 编码 的 基本 思想 是 只 对 运动 图 像 从 一 帧 到 下 一 帧 的 变化 部 分 进行 存储 ,而 并 非 存 储 
全 部 图 像 数据 ,因而 可 以 极 大 地 减少 运动 图 像 数 据 的 存储 量 , 达 到 帧 间 压缩 的 目的 。 如 表 9-16 
所 示 , 将 帧 序列 划分 成 T 帧 P 帧 B 帧 3 种 类 型 ,使 用 参照 帧 及 运动 补偿 技术 来 实现 帧 间 编 码 。 


表 9-16 上 帧 序列 的 分 类 


帧 类 型 意 义 
在 解码 时 ,无 须 参照 任何 其 他 帧 的 帧 图 像 称 为 1 帧 ,或 称 为 内 编码 帧 , 它 是 利用 自身 
I 帧 的 相关 性 进行 帧 内 压缩 编码 , 它 给 编码 序列 的 解码 的 起 始 提供 操作 点 ,满足 随机 操作 
的 要 求 ,但 仅 能 获得 中 等 的 编码 压缩 比 
Pp 由 在 帧 编码 时 , 仅 使 用 最 近 的 前 一 帧 (I 帧 或 P 帧 ) 作 为 参照 帧 时 ,该 帧 称 为 P 帧 ,或 称 


为 预测 帧 ; P 帧 利用 过 去 的 工 帧 或 P 帧 进行 运动 补偿 预测 ,可 得 到 更 有 效 的 编码 

在 帧 编码 时 ,要 使 用 前 后 帧 作为 参照 帧 时 ,该 帧 称 为 B 帧 ,或 称 为 双向 预测 帧 ; B 帧 
B 帧 能 提供 最 大 限度 的 压缩 , 它 需 要 过 去 和 将 来 的 参考 图 (I 帧 或 P 帧 ) 进 行 运动 补偿 ,但 
它 本 身 不 能 用 作 预 测 参考 图 


提高 帧 间 压 缩 的 有 效 方法 是 通过 采用 运动 补偿 技术 ,在 对 P 帧 或 B 帧 进行 编码 时 ,以 
宏 块 (一 个 宏 块 一 般 可 定义 为 16X16 数据 块 ) 为 基本 编码 单位 ,运动 补偿 技术 可 以 消除 P 帧 
和 也 帧 在 时 间 上 的 宛 余 。 
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MPEG-1 没有 规定 编码 过 程 , 而 仅 规定 了 比特 流 的 语法 和 语义 以 及 解码 器 中 的 信号 处 
理 。 在 有 也 帧 时 ,要 有 两 个 帧 存储 器 分 别 存储 过 去 和 将 来 的 两 个 参考 帧 ,以 便 进 行 双向 运 
动 补偿 预测 。 编 码 器 必须 在 图 像 质量 编码 速率 以 及 编码 效率 之 间 进 行 综合 考虑 ,选择 合适 
的 编码 工作 模式 和 控制 参数 。 此 外 ,标准 在 一 些 具体 模块 的 实现 上 具有 开放 性 ,可 以 自行 选 
用 诸如 运动 矢量 估计 算法 、 图 像 的 刷新 机 制 .编码 控制 机 制 等 。 

MPEG-1 的 解码 无 须 运动 估计 ,只 要 根据 接收 到 的 码 流 的 语义 进行 相应 的 处 理 。 当 一 
幅 图 像 的 所 有 宏 块 都 处 理 完毕 , 则 整个 图 像 被 重建 。 如 果 编 码 序列 包括 B 帧 , 则 解码 后 还 
应 按 显示 顺序 重新 排序 后 才能 进行 显示 。 

3. 编码 视频 流 的 层次 结构 和 组 成 

MPEG-1 规定 了 编码 视频 比特 流 的 语法 。 该 语法 分 为 6 层 , 如 表 9-17 所 示 。 最 高 层 为 
序列 层 , 最 低层 为 块 层 ,每 层 支持 一 个 信号 处 理 或 一 个 系统 功能 ,并 且 设 定 了 必要 的 参数 。 

表 9-17 MPEG-1 语法 表 


语 义 层 功 能 
序列 层 随机 存 取 单元 : 上 下 文 
图 像 组 层 随机 存 取 单 元 : 视频 
图 像 层 初始 编码 单元 
宏 块 条 层 重 同步 单元 
宏 块 层 运动 补偿 单元 
块 层 DCT 单 元 

9.8.2 MPEG-2 


MPEG-2 标准 是 MPEG 工作 组 制定 的 第 二 个 国际 标准 , 即 通用 的 活动 图 像 及 其 伴音 的 
编码 标准 ISO/TEC 13818 ,于 1994 年 制定 ,目标 是 高 级 工业 标准 的 图 像 质量 以 及 更 高 的 传 
输 率 。 它 主要 包括 以 下 几 个 部 分 : 

(1) 系统 。 

(2) 视频 。 

(3) 音频 。 

(4) 一 致 性 。 

(5) 参考 软件 。 

(6) 数字 存储 媒体 的 命令 与 控制 。 

(7) 高 级 音频 编码 。 

(8) 10bit 视频 编码 。 

(9) 实时 接口 。 

对 于 视频 部 分 ,作为 一 个 通用 的 编码 标准 , MPEG-2 比 MPEG-1 具有 更 广泛 的 适应 范 
围 ,能 提供 的 传输 率 在 3 一 10Mb/s 间 ,其 在 NTSC 制式 下 的 分 辩 率 可 达 720X 486, MPEG-2 
也 可 提供 并 能 够 提供 广播 级 的 视 像 和 CD 级 的 音质 。MPEG-2 可 适应 于 标准 数字 电视 、 高 
清 电视 ,同时 也 包括 MPEG-1 的 工作 范围 .音频 编码 可 提供 左右 中 及 两 个 环绕 声 道 ,以 及 一 
个 加 重 低音 声 道 和 多 达 7 个 伴音 声 道 。 由 于 MPEG-2 在 设计 时 的 巧妙 处 理 ,使 得 大 多 数 
MPEG-2 解码 器 也 可 播放 MPEG-1 格式 的 数据 ,如 VCD。 


出 
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MPEG-2 的 解码 器 可 以 对 MPEG-1 码 流 进行 解码 ,并 在 其 基础 上 增加 了 一 些 新 的 编码 
技术 ,MPEG-2 规定 了 4 种 图 像 的 运动 预测 和 补偿 方式 ,引入 了 空间 可 分 级 性 、 时 间 可 分 级 
性 以 及 信 噪 比 SNR 可 分 级 性 3 种 编码 的 可 分 级 性 。 因 此 ,甚至 有 人 认为 ,MPEG-1 已 经 成 
为 MPEG-2 的 一 个 子 集 。 

同时 ,由 于 MPEG-2 的 出 色 性 能 表现 ,已 能 适用 于 HDTYV ,使 得 原 打算 为 HDTYV 设计 
的 MPEG-3, 还 未 完全 推出 就 被 放弃 了 。 除 了 作为 DVD 的 指定 标准 外 ,MPEG-2 还 可 用 于 
为 广播 有 线 电视 网 ,电缆 网 络 以 及 卫星 直播 提供 广播 级 的 数字 视频 。 

MPEG-2 的 男 一 特点 是 ,其 可 提供 一 个 较 广 的 范围 改变 压缩 比 , 以 适应 不 同 画 面 质量 、 
存储 容量 ,以 及 带宽 的 要 求 。 


9.8.3 MPEG-4 


MPEG-4 即 ISO/IEC 14496 ,该 标准 是 一 个 可 适应 各 种 多 媒体 应 用 的 “音频 视觉 对 象 编 
码 ? 标 准 ,MPEG-4 实现 了 从 矩形 帧 到 VOP 的 转变 以 及 基于 像素 的 传统 编码 向 基于 对 象 和 
内 容 的 现代 编码 的 转变 ,这 正体 现 了 传统 视频 编码 与 新 一 代 视频 编码 的 有 机 统一 。 基 于 内 
容 的 交互 性 是 MPEG-4 的 核心 思想 , 它 利 用 很 窗 的 带宽 ,通过 帧 重建 技术 ,压缩 和 传输 数 
据 , 达 到 以 最 少 的 数据 获得 最 佳 的 图 像 质量 ,这 对 于 视频 编码 技术 的 发 展 方向 及 广泛 应 用 都 
具有 特别 重要 的 意义 。 

MPEG-4 具有 版 本 1 和 版 本 2 两 个 版 本 。 版 本 1 于 1998 年 10 月 通过 ,1999 年 2 月 公 


布 ,可 以 分 为 如 下 7 个 部 分 。 
(1) 系统 。 
(2) 视觉 信息 。 
(3) 音频 。 
(4) 一 致 性 。 


(5) 参考 软件 。 

(6) 多 媒体 传送 集成 框架 。 

(7) MPEG-4 工具 (视频 ) 优 化 软件 。 

版 本 2 于 1999 年 12 月 通过 ,MPEG-4 标准 包含 系统 、 视 频 、 音 频 、 一 致 性 和 3D 图 形 一 
致 性 检查 等 27 个 部 分 。MPEG-4 规定 了 各 种 音频 视觉 对 象 的 编码 ,除了 包括 自然 的 音频 视 
频 对 象 以 外 ,还 包括 图 像 . 文 字 和 3D 图 形 以 及 合成 话音 和 音乐 等 。MPEG-4 的 编码 可 以 适 
应 多 种 媒体 的 应 用 需求 , 它 通 过 描述 场景 对 象 的 空间 位 置 和 时 间 关 系 等 ,来 建立 多 媒体 场 
景 ,并 将 它 与 编码 的 对 象 一 起 传输 。 由 于 对 各 个 对 象 进行 独立 的 编码 ,可 以 达到 很 高 的 压缩 
效率 ,同时 也 为 在 接收 端 根据 需要 对 内 容 进 行 操作 提供 了 可 能 ,可 适应 多 媒体 的 人 机 交互 需 
求 。MPEG-4 作为 新 一 代 多 媒体 数据 压缩 编码 的 典型 代表 ,其 领先 思想 是 首次 提出 了 基于 
内 容 、 基 于 对 象 的 压缩 编码 思想 。 它 要 求 对 自然 或 合成 视听 对 象 做 更 多 分 析 和 理解 ,一定 程 
度 上 代表 了 现代 数据 压缩 编码 技术 的 发 展 方向 。 


字 图 像 的 信息 宛 余 主 要 包括 哪 几 方面 ? 
么 是 图 像 信息 的 视觉 宛 余 ? 
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. 图 像 编 码 的 效率 指标 主要 包括 哪些 ? 
. 图 像 数 据 压缩 的 评价 指标 有 哪些 ? 这 些 指 标 是 如 何 定 义 的 ? 
. 试 简 述 什么 是 变 长 最 佳 编 码 定理 。 
. 试 简 述 霍 夫 曼 编码 算法 的 基本 原理 和 步骤 。 
. 试 分 析 霍 夫 曼 编码 有 哪些 特点 。 
. 设 一 幅 灰 度 级 为 5 的 图 像 中 ,各 灰 度 级 分 别 用 S。、Si 、S;、Ss 、Ss 表示 ,对 应 的 概率 分 
别 为 0.375、0.175、0.175、0.15、0.125, 试 采用 霍 夫 曼 编码 方法 对 其 进行 编码 。 

9. 编写 MATLAB 程序 ,实现 图 像 的 霍 夫 曼 编码 。 

10. 香农 一 范 诺 编码 的 理论 基础 是 什么 ” 简 述 该 编码 的 主要 步骤 。 

11. RLE 编码 的 原理 是 什么 ?怎样 实现 RLE 编码 ? 

12. 算术 编码 具有 哪些 特点 ? 

13. 试 简 述 算术 编码 的 原理 和 主要 步骤 。 

14. 设 图 像 信 源 编码 可 用 a、b、c、d 共 4 个 符号 表示 ,车 图 像 信 源 字符 集 为 {bcabd}), 信 
源 字符 出 现 的 概率 分 别 如 表 9-18 所 示 ,采用 算术 编码 对 该 图 像 字符 集 进行 编码 。 

表 9-18 ”图像 信 源 字符 出 现 概率 
信 源 字符 a b c ad 
出 现 概 率 0.2 0.4 0.2 0.2 


Im 人 w 


15. 什么 是 位 平面 编码 ? 灰 度 图 像 位 平面 分 解 中 ,高 位 面 和 低位 面 有 何 特点 ? 

16. 预测 编码 主要 包括 哪 几 种 类 型 ? 

17. 试 简 述 图 像 变换 编码 的 基本 原理 。 

18. 试 简 述 静止 图 像 压缩 编码 的 技术 标准 JPEG 由 几 部 分 组 成 。 

19. JPEG 标准 的 DCT 变换 系数 量化 具有 哪些 作用 ? 

20. DCT 系数 量化 后 ,为 什么 需 进行 Z 形 扫描 ? 

21. 试 简 述 DCT 系数 编码 的 主要 步 又 。 

22. 与 JPEG 基本 系统 相 比 ,JPEG 2000 采用 了 哪些 新 的 图 像 压缩 编码 技术 ? 

23. 若 一 幅 图 像 的 8X8 图 像 子 块 的 亮度 数据 如 图 9-17 所 示 , 试 对 其 按 JPEG 基本 系统 


进行 编码 。 
128 121 109 7 [| 2 [| ea 56 62 
139 126 102 74 | 7 66 68 87 
109 102 98 89 | 76 68 89 103 
97 117 117 7 | 14 94 103 79 
164 149 | 88 87 | % 91 74 68 
147 94 | 90 102 | 84 72 82 102 
95 9 | 1 19 | 14 122 137 150 
111 112 | 140 150 | 157 163 161 157 


图 9-17 原始 图 像 8X8 子 块 亮度 数据 表 
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CHAPTER 10 


数学 形态 学 (mathematical morphology) 理 论 诞生 于 1964 年 ,法 国 巴 黎 矿 业 学 院 博士 生 
赛 拉 (J. Serra) 和 导师 马 巧 荣 (G. Matheron) 在 从 事 铁 矿 矿山 的 定量 岩石 学 分 析 及 预测 其 开 
采 价 值 时 ,提出 了 击 中 / 击 不 中 变换 、 开 闭 运算 等 概念 和 理论 ,从 此 开启 了 形态 学 的 应 用 
研究 。 

数学 形态 学 的 基本 思想 是 用 具有 一 定形 态 的 结构 元 素 去 量度 和 提取 数字 图 像 中 的 对 应 
形状 ,以 实现 对 图 像 进行 分 析 和 识别 的 目的 。 形 态 学 分 析 是 一 门 建立 在 集合 论 基 础 上 的 学 
科 , 它 是 几何 形态 分 析 和 描述 的 有 力 工具 ,是 一 种 新 的 图 像 处 理 与 分 析 方 法 。 近 年 来 ,形态 
学 分 析 在 数字 图 像 和 机 器 视觉 领域 得 到 了 广泛 应 用 ,其 基本 思想 是 用 一 定形 态 的 结构 元 素 
去 度量 和 检测 被 度量 图 像 中 的 对 应 形状 ,以 达到 对 图 像 进 行 分 析 和 识别 的 目的 。 

数学 形态 学 的 基本 思想 也 适应 于 图 像 处 理 的 很 多 方面 ,包括 图 像 增 强 、 边 缘 检 测 、 图 像 
分 割 . 特 征 提取 、 图 像 复 原文 字 识 别 、 医 学 图 像 处 理 、 图 像 压 缩 `. 材 料 科学 以 及 机 器 视觉 等 众 
多 领域 。 在 工农 业 生 产 中 ,视觉 检测 、 零 部 件 检测 ,产品 质量 检测 、 食 品 安全 检测 .生物 医学 
图 像 分 析 和 纹理 分 析 等 方面 取得 了 非常 成 功 的 应 用 ,创造 了 较 好 的 经 济 效益 和 社会 效益 。 
从 某 种 意义 上 讲 ,数学 形态 学 已 经 构成 了 一 种 新 型 的 数字 图 像 分 析 方法 和 理论 ,并 已 成 为 图 
像 工程 技术 人 员 进 行 图 像 分 析 的 得 力 助 手 。 本 章 先 介绍 数学 形态 学 的 基本 概念 .定义 和 理 
论 ,然后 介绍 二 值 数学 形态 学 的 基本 理论 ,方法 与 算法 ,再 介绍 灰 度 形态 学 ,最 后 以 二 值 形态 
学 为 例 介绍 数学 形态 学 在 图 像 处 理 中 的 应 用 。 


10.1 数学 形态 学 基础 


10.1.1 形态 学 简介 


赛 拉 和 马 瑟 荣 在 进行 岩 相 学 的 定量 分 析 时 第 一 次 引入 了 形态 学 的 数学 表达 式 及 理论 ， 
建立 了 颗粒 分 析 方 法 。 他 们 师 徒 二 人 在 提出 击 中 / 击 不 中 变换 和 开 闭 运算 之 后 ,又 提出 了 布 
尔 模型 及 纹理 分 析 器 原型 等 概念 和 理论 ,奠定 了 数学 形态 学 的 基础 理论 和 工程 应 用 基础 。 

数学 形态 学 的 主要 方法 是 采用 具有 一 定形 态 的 “结构 元 素 ” 去 量度 和 提取 图 像 中 的 对 应 
形状 ,从 而 实现 对 图 像 进行 分 析 和 识别 。 形 态 学 的 基础 主要 基于 集合 论 , 因 此 它 具 有 坚实 而 
完备 的 数学 基础 ,数学 形态 学 完备 的 理论 基础 为 它 用 于 图 像 分 析 和 处 理 、 形 态 滤波 器 的 特性 
分 析 和 系统 设计 提供 了 依据 。 数 学 形态 学 用 于 图 像 分 析 与 处 理 可 以 简化 图 像 数 据 、 保 持 它 
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们 基本 的 形状 特性 ,并 除去 不 相干 的 结构 。 数 学 形态 学 的 计算 方法 具有 天 然 的 并 行 实现 结 
构 ,实现 了 形态 学 分 析 和 处 理 算法 的 并 行 计算 ,提高 了 图 像 分 析 和 处 理 的 速度 。 

在 数学 形态 学 中 ,用 集合 来 描述 图 像 目 标 以 及 图 像 各 部 分 之 间 的 关系 ,说 明 目 标的 结构 
特点 。 数 学 形态 学 由 一 组 形态 学 的 代数 运算 子 组 成 ,其 基本 运算 如 下 : 

(1) 膨胀 与 腐蚀 。 

(2) 开 运 算 与 闭 运算 。 

(3) 击 中 与 击 不 中 。 

(4) 细 化 与 粗 化 。 

这 些 基本 运算 子 在 二 值 图 像 和 灰 度 图 像 中 各 有 特点 ,基于 这 些 基本 运算 还 可 推导 和 组 
合 构 成 其 他 数学 形态 学 的 实用 算法 ,用 它们 可 以 完成 包括 图 像 分 割 、 特 征 抽取 、 边 缘 检 测 图 
像 滤波 等 在 内 的 图 像 形状 和 结构 的 分 析 与 处 理 。 

数学 形态 学 用 集合 的 概念 对 图 像 目 标 进行 描述 ,描述 图 像 各 部 分 之 间 的 关系 ,分 析 目 标 
的 结构 特点 。 在 分 析 和 考察 图 像 时 ,要 设计 一 种 收集 图 像 信息 的 “ 探 针 ”, 称 为 结构 元 素 。 结 
构 元 素 通常 比 待 分 析 和 处 理 的 图 像 简单 ,尺寸 也 要 小 一 些 ,如 圆 形 、 正 方形 ,线段 的 集合 可 作 
为 结构 元 素 。 当 被 处 理 的 图 像 是 二 值 图 像 时 ,结构 元 素 也 采用 二 值 图 像 ; 当 被 处 理 的 图 像 
是 灰 度 图 像 时 , 则 采用 灰 度 图 像 作为 结构 元 素 。 处 理 图 像 时 ,通过 在 图 像 中 不 断 移动 结构 元 
素 , 分 析 和 考察 图 像 中 各 部 分 之 间 的 关系 ,提取 有 用 的 信息 进行 结构 分 析 和 描述 。 使 用 不 同 
的 结构 元 素 和 形态 学 算 子 可 以 获得 目标 的 大 小 、 形 状 、 连 通 性 和 方向 等 重要 信息 。 数 学 形态 
学 基于 探测 的 思想 ,与 人 类 的 FOA (focus of attention ) 的 视觉 特点 有 类 似 之 处 。 作 为 探 针 
的 结构 元 素 ,其 形态 .大 小 . 灰 度 和 色 度 信息 携带 有 目标 的 知识 信息 ,因此 可 以 分 析 和 探测 图 
像 的 结构 特点 。 

数学 形态 学 的 基本 思想 及 方法 可 适用 于 图 像 处 理 的 很 多 方面 ,如 击 中 / 击 不 中 变换 可 以 
用 于 目标 识别 ,流域 的 概念 可 以 用 于 图 像 分 割 ,腐蚀 和 开 运 算 可 以 用 于 骨架 抽取 ,形态 学 滤 
波 器 可 以 用 于 颗粒 分 析 等 。 可 以 说 ,目前 还 没有 一 种 方法 能 像 数 学 形态 学 一 样 , 既 有 严密 的 
理论 基础 ,又 具有 简洁 、 朴 素 、 统 一 的 表达 方法 和 思想 ,而且 具 有 广泛 的 应 用 价值 。 因 此 ,有 
人 说 数学 形态 学 理论 严密 ,完备 ,概念 清晰 ,应 用 简单 。 

数学 形态 学 是 建立 在 严密 数学 理论 基础 上 的 应 用 学 科 , 其 方法 对 图 像 处 理 的 理论 和 工 
程 应 用 产生 了 重要 的 影响 。 不 可 否认 ,数学 形态 学 已 成 为 一 种 新 的 图 像 处 理 方法 ,并 已 应 用 
到 数字 图 像 分 析 、 处 理 及 一 些 其 他 学 科 上 。 数 学 形态 学 方法 在 计算 机 文字 识别 、 显 微 图 像 分 
析 ( 定 量 金 相 分 析 、 颗 粒 分 析 ) 、 医 学 图 像 处 理 ( 细 胞 检测 .CT/MRI 图 像 处 理 )、 图 像 编 码 、 工 
业 检 测 ( 如 食品 安全 检测 .印刷 电路 检测 .产品 质量 检测 )、 材 料 科 学 .指纹 检测 、 地 理 信息 、 合 
成 音乐 .机 器 视觉 等 工程 方面 的 应 用 已 趋 于 成 熟 , 并 在 不 断 开 拓 新 的 应 用 领域 。 


10.1.2 术语 和 定义 


数学 形态 学 的 理论 建立 在 集合 论 的 基础 之 上 ,因此 在 介绍 数学 形态 学 的 算法 之 前 , 先 介 
绍 一 些 集合 论 和 数学 形态 学 的 符号 和 术语 。 

1. 元 素 与 集合 

(1) 集合 : 将 一 些 可 区 别 的 客体 . 按 其 共同 特性 进行 汇集 ,具有 共同 特性 的 这 些 客体 的 
全 体 成 员 称 为 集合 。 例 如 ,图 像 中 灰 度 级 相同 的 区 域 就 可 构成 一 个 集合 。 集 合 通常 用 大 写 
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字母 A,B,C,… 表 示 。 如 果 某 种 客体 不 存在 ,就 称 这 种 客体 的 全 体 是 空 集 , 记 为 所。 

(2) 元 素 : 组 成 集合 的 各 个 客体 , 称 为 该 集合 的 元 素 , 又 称 为 集合 的 成 员 。 如 一 幅 图 像 
中 物体 上 的 任 一 像素 都 可 以 是 元 素 。 常 用 小 写字 母 a,b,c,… 表 示 元 素 。 任 何 客体 都 不 是 
空 集 世 的 元 素 。 若 a€ A ,表示 a 是 集合 A 的 元 素 。 

(3) 子 集 : 集合 A 包含 集合 B 的 充 要 条 件 是 集合 B 的 每 个 元 素 都 是 集合 A 的 元 素 , 也 
可 以 称 为 集合 B 包含 于 集合 A。 记 为 BSA, 即 B 包含 于 A, 或 A 包含 B。 又 称 B 是 A 的 
子 集 。 若 集合 A 与 B 相等 , 必 有 BSA, 同 时 ASB。 

在 基于 数学 形态 学 的 数字 图 像 处 理 与 运算 中 ,一 幅 图 像 可 称 为 一 个 集合 。 对 于 二 值 图 
像 而 言 ,习惯 上 认为 取 值 为 1 的 点 对 应 于 景物 中 心 , 用 阴影 表示 ,而 取 值 为 0 的 点 组 成 背景 ， 
用 和 白色 表示 ,这 类 图 像 的 集合 是 直接 表示 的 。 考 虑 所 有 值 为 1 的 点 的 集合 为 A, 则 A 与 图 
像 是 一 一 对 应 的 。 对 于 一 幅 图 像 A, 如 果 点 a 在 A 的 区 域 之 内 ,那么 就 说 a 是 A 的 元 素 , 记 
为 aEA, 若 0 不 在 A 的 区 域 之 内 , 则 2 不 是 A 的 元 素 , 记 作 5&A, 如 图 10-1 所 示 。 

如 图 10-2 所 示 ,对 于 两 幅 图 像 A 和 B ,车 图 像 B 中 的 每 一 个 点 5 ,如 果 5E A 都 成 立 , 则 
称 B 包含 于 A, 记 作 BSA。 如 果 图 像 A 中 至 少 存在 一 个 点 a, 即 a€A, 且 a#B, 则 称 B 是 
A 的 真子 集 , 记 作 BCA。 


章光 
: (E> 
SS a 
4 4 
图 10-1 元 素 与 集合 间 的 关系 图 10-2 集合 之 间 的 关系 


根据 集合 的 定义 可 知 , 对 于 图 像 A 和 B: 

(1) 如 果 BCA ,那么 必 有 BSEA; 

(2) ASA 恒 成 立 。 

2. 交集 .并 集 和 补 集 

交集 .并 集 和 补 集 是 集合 论 中 的 基本 运算 。 

1) 交集 

两 个 图 像 集合 A 和 B 的 公共 点 组 成 的 集合 称 为 两 个 集合 的 交集 , 记 为 A 门 B, 即 
ANB={ala€E AHaE€B) 

2) 并 集 

两 个 集合 A 和 B 的 所 有 元 素 组 成 的 集合 称 为 两 个 集合 的 并 集 , 记 为 AUB, 即 
AUB={ala€ A 或 a€B} 

3) 补 集 

对 一 幅 图 像 A, 在 图 像 A 区 域 以 外 的 所 有 点 构成 的 集合 称 为 A 的 补 集 , 记 为 Ac , 即 

N= tap A)} 

交集 .并 集 和 补 集运 算 的 几何 图 解 分 别 如 图 10-3(a)、(b)、(c) 所 示 。 


| 加 257 


258 去 i】 数字 图 像 处 理 及 应 用 一 一 使 用 MATLAB 分 析 与 实现 


4UB 
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(b) (9) 


图 10-3 集合 的 交集 .并 集 和 补 集 运算 


3. 击 中 与 击 不 中 

1) 击 中 (hit) 

如 图 10-4 所 示 , 设 有 两 幅 图 像 A 和 B, 如 果 AN 门 B 隆 多, 则 称 B 击 中 A, 记 为 BA。 
2) 击 不 中 (miss) 

对 于 如 图 10-5 所 示 的 两 幅 图 像 A 和 B, 如 果 A 站 B= 多 , 则 称 B 击 不 中 A。 


Es 


图 10-4 B 击 中 A 图 10-5 B 击 不 中 A 
4. 平移 和 映射 
1) 平移 
设 A 是 一 幅 如 图 10-6(a) 所 示 的 数字 图 像 ,b 是 一 个 点 ,如 图 10-6(b) 所 示 。 
灶 功 
5 5 
4 » ， 4 
FE . . 四 得 
区 + + + 2 
1 1Fb 
of 1 2 3 4 SX o 1 2 3 4 克 
(a) 平移 前 图 像 (b) 平 移 点 b 


图 10-6 平移 


定义 A 被 5 平移 后 的 结果 可 表示 为 A 十 5 二 {a 十 bla€ A}, 即 取出 A 中 的 每 一 个 点 a 的 
坐标 值 , 将 其 与 点 5 的 坐标 求 和 ,得 到 一 个 新 的 点 的 坐标 a 十 5, 这 些 新 点 所 构成 的 图 像 就 是 
A 被 5 平移 的 结果 , 记 为 A 十 5b, 如 图 10-7 所 示 。 

2) 映射 

映射 又 称 为 映像 ,还 可 以 称 为 反射 。A 的 映射 结果 可 表示 为 A"= 二 {a 一 a€ A), 即 将 A 
中 的 每 一 个 点 取 反 以 后 所 得 的 新 图 像 称 为 映射 ,如 图 10-8 所 示 。 
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of 1 2 3 4 5x | 


图 10-7 平移 图 10-8 映射 


5. 结构 元 素 

结构 元 素 是 数学 形态 学 中 一 个 非常 最 重要 而 又 基础 的 概念 。 习 惯 上 ,数学 形态 学 方法 
称 被 处 理 的 图 像 为 目标 图 像 , 一 般 用 大 写字 母 表示 。 为 了 确定 目标 图 像 的 结构 ,必须 逐一 考 
察 图 像 各 部 分 之 间 的 关系 ,并 进行 检验 ,最 后 得 到 一 个 各 部 分 之 间 关系 的 集合 。 在 考察 目标 
图 像 各 部 分 之 间 的 关系 时 ,需要 设计 一 种 收集 信息 的 “ 探 针 ”, 称 为 “结构 元 素 ”。 结 构 元 素 具 
有 一 定 的 几何 形状 , 圆 形 .正方 形 .十 字形 ,有 向 线段 的 集合 等 都 可 以 作为 结构 元 素 ,分 析 时 
在 目标 图 像 中 移动 结构 元 素 便 可 以 考察 图 像 中 各 部 分 之 间 的 关系 ,从 而 提取 有 用 的 特征 信 
息 , 实 现 对 图 像 的 分 析 和 描述 。 

eigen oa 滤波 窗口 ”或 “参考 模板 ”的 作 

。 对 于 每 一 个 结构 元 素 ,需要 指定 一 个 原点 结构 元 素 参与 形态 学 运算 的 参考 点 ,该 
he Pe 圭 构 元 素 中 ， tien 但 两 者 运算 的 结果 可 能 不 同 。 

结构 元 素 同 样 用 大 写 英 文字 母 表示 。 通 过 不 断 移 动 结构 元 素 , 就 可 以 研究 图 像 中 各 部 
分 之 间 的 关系 。 一 般 结构 元 素 的 尺寸 应 明显 小 于 目标 图 像 的 尺寸 ,结构 元 素 的 选取 会 直接 
影响 形态 运算 的 效果 ,因此 ,应 根据 具体 情况 确定 结构 元 素 。 结 构 元 素 的 选取 一 般 应 遵循 以 
下 原则 : 

(1) 结构 元 素 必须 在 几何 上 比 原 图 像 简 单 并 有 界 ,尺寸 应 小 于 被 分 析 的 图 像 ,当选 择 性 
质 相 同 或 相似 的 结构 元 素 时 ,以 选取 图 像 某 些 特征 的 极限 情况 为 宜 。 

(2) 结构 元 素 的 形状 最 好 具有 某 种 凸 性 ,如 圆 形 .十字架 形 方形 等 。 对 非 凸 性 子 集 , 由 
于 连接 两 点 的 线段 有 些 部 分 位 于 集合 的 外 面 , 即 在 其 补 集 上 ,因此 ,采用 非 凸 性 子 集 作为 结 
构 元 素 难 以 提取 更 多 的 有 用 信息 ,在 分 析 和 讨论 时 一 般 采 用 圆 形 .十 字 架 形 、 正 方形 等 作为 
结构 元 素 。 


10.2 二 值 形 态 学 


二 值 形态 学 的 运算 对 象 是 集合 。 设 A 为 一 幅 图 像 ,S 为 结构 元 素 , 实 际 上 ,结构 元 素 自 
身 也 是 一 个 图 像 (集合 ) 。 数 学 形态 学 运算 是 指 用 S 对 A 进行 运算 或 操作 ,对 每 个 结构 元 素 
可 以 指定 一 个 原点 作为 参考 点 。 
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10.2.1 腐蚀 


腐蚀 是 最 基本 的 一 种 数学 形态 学 运算 。 腐 蚀 运算 在 数 
学 形态 学 图 像 处 理 中 的 作用 是 可 以 消除 物体 的 边界 点 。 对 
一 个 给 定 的 目标 图 像 X 和 一 个 结构 元 素 S ,将 S 在 图 像 X 
上 移动 ,运动 到 每 一 个 当前 位 置 x,S 十 x 只 有 如 下 三 种 可 能 
的 状态 ,如 图 10-9 所 示 。 


S+x» 
(1) S 十 zEX。 
(2) Si EN 图 10-9 S 十 z 的 三 种 状态 
(3) S 十 x 站 X 与 S 十 xz 门 Xs 均 不 为 空 集 。 


情况 (1) 说 明 S 十 z 与 X 相关 最 大 ,情况 (2) 表 明 S+z 与 X 完全 不 相关 ,情况 (3) 表 明 
S 十 zx 与 X 存在 部 分 相关 。 因 而 满足 上 述 三 条 的 全 体 z 点 的 集合 构成 结构 元 素 与 图 像 X 的 
最 大 相关 点 集 , 这 个 点 集 称 为 S 对 X 的 腐蚀 (简称 腐蚀 ,有 时 也 称 X 用 S 进行 腐蚀 ) , 记 
为 X@S。 

腐蚀 也 可 用 集合 来 进行 定义 , 即 

XeSs =({z1S+zEX) (10-1) 

式 (10-1) 表 明 ,X 用 S 腐蚀 的 结果 是 所 有 使 S 平移 xz 后 仍 在 X 之 中 的 全 体 z 的 集合 。 
也 就 是 说 ,用 S 来 腐蚀 X 得 到 的 集合 是 S 完全 包括 在 X 中 时 S 的 原点 位 置 的 集合 。 

腐蚀 运算 可 以 消除 物体 的 边界 点 。 例 如 ,车 结构 元 素 选取 3X3 的 矩形 块 ,对 图 像 进行 
腐蚀 运算 将 使 原 图 像 的 边界 沿 周边 减少 一 个 像素 。 选 取 适 当 大 小 的 结构 元 素 , 腐 蚀 运 算 可 
以 将 图 像 内 小 于 结构 元 素 的 物体 ,如 毛刺 、 小 凸 起 等 消除 ,通过 取 不 同 大 小 的 结构 元 素 ,就 可 
以 在 原 图 像 中 去 掉 不 同 大 小 的 物体 。 因 此 , 若 两 个 物体 之 间 有 小 的 连通 区 域 , 当 结构 元 素 大 
小 适当 时 ,腐蚀 运算 可 以 将 两 个 物体 分 开 。 

为 加 深 对 腐蚀 运算 的 理解 , 接 下 来 分 析 两 个 腐蚀 运算 实例 。 

例 10-1: 腐蚀 运算 示例 1 

如 图 10-10 所 示 为 腐蚀 运算 示例 。 如 图 10-10(a) 为 原始 图 像 ( 集 合 )A, 图 10-10(b) 为 
结构 元 素 , 图 10-10(c) 为 腐蚀 运算 结果 。 


(a) 图 像 4 (b) 结构 元 素 S (0) 腐蚀 运算 结果 
图 10-10 ”腐蚀 运算 


例 10-2: 腐蚀 运算 示例 2 

如 图 10-11 为 腐蚀 运算 的 一 个 典型 示例 。 图 10-11(a) 中 的 阴影 部 分 为 集合 X， 
图 10-11(b) 中 的 阴影 部 分 为 结构 元 素 S, 而 图 10-11(c) 中 的 深 黑 色 部 分 即 XBS 运算 的 结 
果 。 由 图 10-11(c) 可 见 , 腐 蚀 运 算 使 图 像 收缩 变 小 了 。 
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(a) 图 像 X (b) 结构 元 素 $ (c) 腐蚀 运算 结果 
图 10-11 腐蚀 示意 图 


通过 观察 上 述 两 个 腐蚀 运算 的 例题 ,对 腐蚀 运算 的 作用 有 了 进一步 的 理解 。 根 据 腐蚀 
运算 的 定义 可 以 得 知 ,车 S 包含 了 原点 , 即 OE S, 则 XBS 将 是 X 的 一 个 收缩 , 即 X@SEX 
( 当 OES 时 ); 若 S 不 包含 原点 ,那么 XBSSX 并 不 一 定 成 立 。 若 结构 元 素 S 关于 原点 O 
是 对 称 的 ,那么 S=S”。 

由 此 可 得 X86S 二 XBS" ,但 是 , 若 S 关于 原点 O 不 对 称 , 则 X 被 S 腐蚀 的 结果 与 X 被 
SY 腐蚀 的 结果 不 相同 。 根 据 腐 蚀 运算 的 定义 可 以 直接 给 出 腐蚀 算法 ,腐蚀 运算 还 有 如 下 所 
示 的 另 一 种 表达 式 ， 


X9S =U (S 十 XI 一 ES)} (10-2) 
式 (10-2) 可 从 定义 式 (10-1) 导 出 , 它 将 腐蚀 表示 为 图 像 平移 的 交 ,这 在 某 些 并 行 处 理 
环境 中 比较 具有 应 用 价值 。 


10.2.2 膨胀 


腐蚀 可 以 视 为 将 图 像 X 中 每 一 与 结构 元 素 S 全 等 的 子 集 S 十 z 收缩 为 点 z+。 反 之 ,也 
可 以 将 X 中 的 每 一 个 点 扩大 为 S 十 z, 这 就 是 膨胀 运算 , 记 为 XS。 膨 胀 运算 定义 为 
XS=(zlS+zUz 天 办 (10-3) 
例 10-3: 膨胀 运算 示例 
仍 以 图 10-10(a) 所 示 图 像 (集合 )A 和 图 10-10(b) 所 示 的 结 
构 元 素 S 为 例 进行 膨胀 运算 , 即 用 结构 元 素 S 对 A 进行 膨胀 ,其 
结果 如 图 10-12 所 示 ( 图 中 的 虚线 区 域 为 原始 图 像 A) 。 
膨胀 运算 的 另 一 种 等 价 定义 如 下 : 
ol XBS=N{X+s|sES} (10-4) 
(3) XBS=N{S+zlzr€ES} (10-5) ”图 10-12 膨胀 运算 结果 
上 述 各 式 中 , 式 (10-3) 和 式 (10-4) 在 进行 算法 设计 时 更 方 
便 , 而 式 (10-5) 突 出 了 算法 的 几何 特性 。 根 据 定 义 (10-3) 可 知 , 腐 蚀 和 膨胀 运算 对 集合 运 
算 的 分 配 律 只 有 在 特定 情况 下 才 成 立 ,在 应 用 时 应 注意 。 另 外 ,用 腐蚀 和 膨胀 运算 也 可 以 实 
现 图 像 的 平移 。 若 自 定义 结构 元 素 时 选择 不 在 原点 的 某 一 点 作为 结构 元 素 , 则 得 到 的 图 像 
形状 没有 任何 改变 ,只 是 位 置 发 生 了 移动 。 
根据 腐蚀 和 膨胀 的 定义 ,腐蚀 和 膨胀 运算 具有 对 偶 性 ,其 对 偶 性 可 用 如 下 表达 式 表示 : 
(A®S)° = AQS" 
(A@S)c = A MS 
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例 10-4: 腐蚀 与 膨胀 对 偶 运 算 示 例 

二 值 腐蚀 和 膨胀 运算 可 以 用 如 图 10-13 所 示 进 行 解释 。 图 10-13(a) 和 图 10-13(b) 为 
A 和 S, 图 10-13(c) 为 AS, 图 10-13(d) 为 SY ,A 四 S 的 运算 结果 如 图 10-13(e) 所 示 ,而 A8S 
的 运算 结果 如 图 10-13(f) 所 示 , AS@SY 的 运算 结果 如 图 10-13(g) 所 示 ,AS 四 SY 的 运算 结 
果 如 图 10-13(h) 所 示 ,图 解 中 , 深 色 点 在 膨胀 结果 中 表示 膨胀 出 来 的 点 ,而 在 腐蚀 结果 中 表 


示 腐 蚀 掉 的 点 。 
(b) © (d) 
人 (8) (h) 


图 10-13 腐蚀 与 膨胀 运算 对 偶 性 图 解 


(a) 


(e) 


10.2.3” 开 运算 与 闭 运算 
1. 基本 概念 
车 结构 元 素 为 一 个 小 的 圆 形 , 则 膨胀 可 填充 图 像 中 比 结构 元 素 小 的 孔洞 以 及 图 像 边 缘 
处 的 小 凹陷 ,使 图 像 扩 大 ; 而 腐蚀 运算 可 以 消除 图 像 边 缘 的 某 些小 区 域 ,并 将 图 像 缩小 ,其 
补 集 扩 大 。 但 是 ,膨胀 和 腐蚀 并 非 互 道 运算 ,因此 它们 可 以 进行 级 联 使 用 。 在 腐蚀 和 膨胀 运 
算 的 基础 上 ,可 以 构造 数学 形态 学 的 其 他 运算 算 子 ,它们 由 腐蚀 与 膨胀 两 个 基本 运算 的 复合 
运算 与 集合 操作 (并 、 交 、 补 等 ) 组 合成 的 所 有 运算 构成 。 如 可 先 对 图 像 进行 腐蚀 再 进行 膨 
胀 ,或 先 对 图 像 进行 膨胀 然后 再 进行 腐蚀 (同一 个 结构 元 素 )。 前 者 称 为 开 运算 (又 称 为 开启 
运算 ) ,后 者 称 为 闭 运算 (又 称 为 闭合 运算 ) 。 开 运算 和 闭 运 算是 形态 学 中 两 个 非常 重要 的 组 
合 运算 。 
对 图 像 X 及 结构 元 素 S ,用 符号 X*S 表示 S 对 图 像 X 作 开 运算 ,用 符号 X。S 表示 S 
对 图 像 X 作 闭 运算 ,它们 的 定义 为 
XS={(X8S)®S} (10-6) 
X.S={(X®S)es} (10-7) 
由 式 (10-6) 和 式 (10-7) 可 知 ,X*S 是 指 先 进行 腐蚀 运算 后 进行 膨胀 运算 的 复合 运算 ， 
可 视 为 对 腐蚀 图 像 XOS 再 进行 膨胀 运算 进行 恢复 ,而 X。S 是 指 先 进行 膨胀 运算 后 进行 腐 
蚀 运 算 的 复合 运算 ,可 看 作 是 对 膨胀 图 像 XS 再 用 腐蚀 运算 进行 恢复 。 需 要 指出 的 是 ,这 
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一 恢复 不 是 信息 无 损 的 , 即 它们 通常 不 等 于 原始 图 像 X。 由 开 运算 的 定义 式 , 可 以 得 出 
XS=N {S+z|S+xzCX) (10-8) 
因而 X*S 是 由 所 有 X 中 与 结构 元 素 S 完全 相等 的 子 集 的 并 组 成 的 。 或 者 说 ,对 XS 
中 的 每 一 个 点 z, 均 可 找到 某 个 包含 在 X 中 的 结构 元 素 S 经 过 平移 (平移 结果 为 S 十 y)， 
使 得 


rESt+y 

即 工 在 集合 X 的 附近 具有 不 小 于 S 的 几何 结构 ,而 对 于 X 中 不 能 被 X*S 恢复 的 点 ,其 
附近 的 几何 结构 比 S 都 要 小 。 上 述 分 析 说 明 ,Xs*S 是 一 个 基于 几何 结构 的 滤波 器 。 

例 10-5: 开 运 算 实例 

本 示例 是 一 道 典型 的 开 运算 的 运算 原理 图 解 题 , 如 图 10-14 所 示 。 图 10-14(a) 为 原始 
图 像 X, 图 10-14(b) 为 结构 元 素 S, 图 10-14(c) 为 开 运算 结果 。 从 该 例 可 以 观察 到 ,集合 X 
经 过 开 运 算 后 ,图 像 内 细小 的 连接 被 消除 了 。 


(a) 集合 (b) 集合 5 (©) 开 运算 结果 
图 10-14 开 运算 实例 图 解 


例 10-6: 闭 运算 实例 

本 示例 是 一 道 典型 的 闭 运 算 原理 图 解 题 ,如 图 10-15 所 示 。 图 10-15(a) 为 原始 圆 形 图 
像 X, 图 10-15(b) 为 结构 元 素 S, 图 10-15(c) 为 闭 运算 结果 。 该 例 表 明 , 集 合 X 经 过 闭 运算 
后 ,图 像 内 的 小 凹陷 消失 了 。 


O 


(a) 集合 XY (b) 集合 8 (c) 闭 运算 结果 
图 10-15 闭 运算 实例 图 解 


通过 上 述 开 、 闭 运算 的 例题 可 以 发 现 , 开 运算 对 图 像 的 边界 起 到 了 平滑 作用 ,因此 ， 
图 10-14(a) 的 图 像 X 被 分 开 为 两 个 矩形 ; 而 闭 运算 可 实现 对 图 像 的 凹陷 部 分 进行 适当 的 
填补 。 例 10-5 和 例 10-6 表明 ,采用 不 同 的 结构 元 素 .可 提取 到 图 像 的 不 同 特征 。 开 、 闭 运 
算 不 受 原点 是 否 在 结构 元 素 之 中 的 影响 。 使 用 不 同 的 结构 元 素 , 开 、 闭 运算 的 特性 将 得 到 进 
一 步 认 识 。 
由 腐蚀 和 膨胀 的 对 偶 性 ,可 得 出 开 、 闭 运算 也 是 一 对 对 偶 变换 , 即 
(Xc。S)5 一 X。S (10-9) 
(X¢»S)=X.S (10-10) 
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因此 , 闭 运算 的 几何 意义 可 以 由 补 集 的 开 运 算 的 几何 意义 得 出 。 

2. 开 闭 运算 的 代数 性 质 

由 于 开 、 闭 运算 是 定义 在 腐蚀 和 膨胀 运算 的 基础 上 ,因此 根据 腐蚀 和 膨胀 运算 的 代数 性 
质 ,可 以 得 出 如 下 性 质 : 


1) 对 偶 性 
(Xc。S)5 一 和 .Si (X°.S)=X°S (10-11) 
2) 扩展 性 
久 5 有 EE (10-12) 
即 开 运算 使 原 图 像 缩 小 ,而 闭 运 算 使 原 图 像 扩 大 。 扩 展 性 又 称 为 收缩 性 。 
3) 单调 性 
车 XCY, 则 
和 (10-13) 
车 YC2Z,Z。Y=2, 则 
站 5 区 世 沽 w 区 (10-14) 
根据 单调 性 可 知 , 若 扩大 后 的 结构 元 素 对 原 结构 元 素 开 运算 不 变 , 则 结构 元 素 的 扩大 可 


保持 单调 特性 。 
4) 平移 不 变性 
(X+W .+S=(X.S)+h,(X+h)。 S= (X° S)+h 
X»(S+h)=X.S,X。(S+h)=X°.S (10-15) 


5) 等 寡 性 
(XS Xe 《(X"9)vS 一 式 " 三 (10-16) 
开 、 闭 运算 的 等 寡 性 表明 : 经 过 一 次 滤波 就 能 将 所 有 特定 结构 元 素 的 噪声 滤 除 干 
净 ,但 重复 运算 不 再 具有 滤波 效果 。 这 一 性 质 与 中 值 滤波 、 线 性 卷 积 等 性 质 的 滤波 特性 
不 同 。 
6) 开 、 闭 运算 与 集合 的 关系 


ay|U X; 1.5 U (Xi*S), 即 并 集 的 开 运 算 包 含 开 运算 的 并 集 ; 


2) | (1x,|.sce 门 Ceses) , 即 交 集 的 开 运算 包含 于 开 运算 的 交集 中 ; 


(3) Xi | . sU (X;，。，S), 即 并 集 的 闭 运算 包含 闭 运算 的 并 集 ; 


| 站 : 才 刁 Nn (X;* S) , 即 交集 的 闭 运 算 包 含 于 闭 运 算 的 交集 中 。 


在 对 多 个 图 像 进行 开 、 闭 运算 时 ,运用 上 述 集 合 方面 的 性 质 可 以 显著 提高 开 、 闭 运算 的 


10.2.4 击 中 与 击 不 中 
数学 形态 学 中 , 除 膨胀 ,腐蚀 、 开 运算 和 闭 运 算 之 外 , 击 中 / 击 不 中 变换 (HMT) 也 是 形态 
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学 的 一 种 基本 运算 ,HMT 变换 可 以 同时 探测 图 像 的 内 部 和 外 部 。 在 研究 图 像 中 的 目标 物 
体 与 图 像 背 景 之 间 的 关系 时 ,HMT 能 够 得 到 很 好 的 效果 ,所 以 击 中 / 击 不 中 变换 常用 于 解 
决 目 标 图 像 识 别 和 模式 识别 等 领域 的 问题 。 

结构 元 素 是 形态 学 变换 中 的 基本 元 素 , 是 为 了 探测 图 像 的 某 种 结构 信息 而 设计 的 特定 
形状 和 尺寸 的 图 像 ,是 一 种 收集 图 像 结 构 信息 的 探 针 。 结 构 元 素 除 圆 形 、 方 形 、 线 型 等 类 型 
外 ,还 有 基于 二 值 的 、 灰 度 值 的 ,模糊 集 的 等 多 种 结构 元 素 。 在 击 中 与 击 不 中 变换 中 将 结构 
元 素 分 解 为 两 部 分 ,一 个 定义 为 前 景 结构 元 素 ,一 个 定义 为 背景 结构 元 素 。 具 体 定义 如 下 : 

设 A 为 待 处 理 图 像 ,B 为 结构 元 素 , 且 由 不 相交 的 两 部 分 Bl 和 B, 组 成 , 且 满 足 如 下 
条 件 : 


B=BiUB, EBNB,=$ 
则 A 被 B 击 中 的 定义 为 


A©B= {zx|1B+zxzSXANB+zx 人 FX} (10-17) 
上 式 中 的 符号 ”人 ?表示 两 个 条 件 应 同时 满足 。 显 然 , 当 B, 二 名 时 , 击 中 变换 就 演变 成 


了 腐蚀 运算 。 

式 (10-17) 也 可 以 定义 为 

A©B = (A8B') 门 (AcB，) (10-18) 

腐蚀 运算 的 结果 是 结构 元 素 S 平移 z 但 仍 包含 在 输入 图 像 A 内 部 的 所 有 结构 元 素 的 
原点 的 集合 ,对 于 HMT 变换 , 当 且 仅 当 结构 元 素 Bi 平移 到 某 一 点 可 以 填 和 人 A 的 内 部 , 且 
B, 平移 到 该 点 时 可 以 填 和 人 A 的 外 部 时 ,该 点 才能 在 HMT 变换 的 结果 中 输出 。 由 于 需要 精 
确 匹 配 ,因此 该 算法 对 识别 的 要 求 很 高 , 若 图 像 包含 未 知 噪声 则 会 出 现 较 大 的 误差 ,处 理 效 
果 将 受到 影响 。 


10.3 灰 度 形态 学 


二 值 形态 学 的 一 些 基 本 理论 可 以 推广 到 灰 度 形态 学 。 如 腐蚀 膨胀. 开 和 闭 等 基本 运算 
都 可 方便 地 推广 到 灰 度 图 像 空间 ,只 是 灰 度 形态 学 的 运算 对 象 不 再 被 视 为 集合 而 看 作 图 像 
函数 。 


10.3.1 有 灰 度 腐蚀 


设 /(z,y) 是 输入 图 像 ,b(z,y) 是 结构 元 素 。 用 结构 元 素 5Cz,y) 对 输入 图 像 fCz,y) 进 
行 灰 度 腐蚀 简 记 为 /85, 其 定义 为 
JOD st) = min{LFG 二 zt 十 y) 一 5Czy) | (+z), GT €E Dj,(r,y) ED) 
(10-19) 


式 中 ,Dr 和 了 D, 分 别 是 f(z,y) 和 6b(zx,y) 的 定义 域 。 
这 里 要 求 (s 十 x,t 十 y) 和 (xz,y) 在 其 定义 域内 ,之 所 以 这 样 要 求 ,与 二 值 腐蚀 运算 的 定 
义 中 要 求 结构 元 素 完全 包括 在 被 腐蚀 集合 中 类 似 。 
若 结构 元 素 是 一 维 函 数 , 则 式 (10-19) 可 简化 为 
(fb)(s) = min{[LFGs 十 z) 一 2Cz) | (二 TzEDrzED) (10-20) 
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例 10-7: 灰 度 腐蚀 运算 示例 
如 图 10-16(a) 和 (b) 分 别 为 图 像 / 和 结构 元 素 5, 用 5b 对 了 进行 腐蚀 操作 的 结果 如 
图 10-16(c) 所 示 。 


(a) 原始 图 像 (b) 结构 元 素 (©) 灰 度 腐蚀 后 的 图 像 
图 10-16 灰 度 腐蚀 后 的 图 像 


腐蚀 运算 是 在 由 结构 元 素 确定 的 邻 域 中 选取 /Bo 的 最 小 值 , 因 此 ,对 灰 度 图 像 的 腐蚀 
操作 有 两 类 效果 : 

(1) 若 结构 元 素 的 值 都 为 正 , 则 处 理 后 的 图 像 会 比 输入 图 像 暗 。 

(2) 若 输入 图 像 中 亮 细节 的 尺寸 比 结构 元 素 小 , 则 影响 将 被 减弱 ,减弱 的 程度 取决 于 这 
些 亮 细 节 周 围 的 灰 度 值 和 结构 元 素 的 形状 与 幅 值 。 


10.3.2 灰 度 膨胀 


用 结构 元 素 b(z,y) 对 输入 图 像 /(z,y) 进 行 灰 度 膨胀 记 为 Fo, 其 定义 为 
(f ODst) 一 max{[LFGs 十 zt 十 y) 十 bzyy) | (s+7x), (t+y) E Dz,y) E D,} 
(10-21) 


式 中 ,Dr 和 DD 分 别 是 f(z,y) 和 6b(z,y) 的 定义 域 。 

这 里 要 求 (s 十 x,t 十 y) 和 (xz,y) 在 其 定义 域内 ,类 似 于 在 二 值 膨胀 定义 中 要 求 两 个 运算 
集合 至 少 有 一 个 非 零 元 素 相交 。 式 (10-21) 与 二 维 离散 函数 的 卷 积 的 形式 很 类 似 , 仅 仅 是 
式 (10-21) 用 max 运算 代替 了 卷 积 的 求 和 ,用 加 法 代替 了 卷 积 的 相 乘 。 若 结构 元 素 为 一 维 
函数 , 则 式 (10-21) 可 简化 为 

(f BD(s) = max([LFGs 十 z) 十 0Cz) | (s+zx) €E Djsx € D,} (10-22) 

和 卷 积 相似 , 若 2 为 正 ,f(z,y) 移 向 右边 ; 若 5 为 负 ,/(z,y) 移 向 左边 。 要 求 (s 十 +) 和 
工 在 其 定义 域内 ,是 为 了 使 /和 4 的 交集 非 空 。 

对 灰 度 图 像 的 膨胀 运算 有 两 类 效果 ， 

(1) 若 结构 元 素 的 值 都 为 正 , 则 处 理 后 的 图 像 会 比 输入 图 像 亮 。 

(2) 根据 输入 图 像 中 暗 区 细节 的 灰 度 值 及 其 形状 相对 于 结构 元 素 的 关系 , 原 图 像 中 的 
暗 区 在 膨胀 中 或 被 消减 或 被 完全 消除 。 


10.3.3 灰 度 开 运 算 与 闭 运 算 


数学 形态 学 中 , 灰 度 开 、 闭 运算 的 定义 与 二 值 数 学 形态 学 中 的 开 、 闭 运算 是 一 致 的 。 因 此 ， 
开 、 闭 运算 的 定义 可 以 类 似 地 给 出 , 即 对 于 开 运 算 先 腐蚀 后 膨胀 ,对 闭 运 算 先 膨胀 后 腐蚀 。 
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站 ear 
结构 元 素 0(z,y) 对 灰 度 图 像 FCz,y) 进 行 开 运 算 记 为 /5, 其 定义 为 

fb5= (190) Db (10-23) 

灰 度 开 运 算 处 理 的 结果 是 小 的 .明亮 的 细节 尺寸 变 小 了 ,而 暗 区 的 效果 没有 明显 的 

变化 。 

2. 闭 运算 

用 结构 元 素 5(z,y) 对 灰 度 图 像 F(z,y) 进 行 闭 运算 记 为 /" 5, 其 定义 为 
fb=(fO@DN (10-24) 


灰 度 闭 运 算 处 理 的 结果 是 小 而 暗 的 细节 尺寸 变 小 了 ,而 明亮 区 域 的 效果 没有 明显 的 
变化 。 


10.4 数学 形态 学 的 应 用 


学 的 腐蚀 、 膨 胀 、 开 、 闭 等 基本 运算 及 相关 性 质 ,通过 
和 灰 度 形 和 实用 算法 。 灰 度 形 态 学 的 主要 算 
梯度 .高 帽 (top-hat) 及 低 帽 (botrhat) 变 换 等 。 数 学 
方法 处 理 实际 图 像 时 ,通常 需要 对 输入 图 像 进 行 


前 面 介绍 了 二 值 形 态 学 和 灰 度 形 
这 些 运算 的 组 合 可 以 得 到 很 多 二 值 
法 F 滑 纹理 分 割 、 形 态 
! ` 泛 的 应 用 ,在 应 用 形态 学 
预 处 理 ， ,以 便 适 合 于 算法 要 求 。 


10.4.1 二 值 形态 学 平滑 滤波 

根据 开 、 闭 运算 的 定义 ,对 于 二 值 图 像 先进 行 开 运 算 , 再 进行 闭 运 算 可 以 实现 图 像 的 平 
滑 滤波 ,消除 图 像 的 部 分 噪声 (如 人 为 的 亮点 和 暗 点 等 )。 

例 10-8: 二 值 形态 学 滤波 示例 

如 图 10-17(a) 集 合 (图 像 )A 存在 若干 人 为 噪声 ,包括 亮点 和 上 暗 点 。 例 如 ,采用 图 10-17(b) 所 
示 圆 形 结构 元 素 , 对 集合 A 先进 行 开 运算 ,然后 再 进行 闭 运算 ,可 消除 噪声 。 处 理 结果 如 


图 10-17(c) 所 示 。 


(a) 集合 4 (b) 结构 元 素 S (0) 滤波 结果 


图 10-17 二 值 形态 学 滤波 示意 图 


图 10-17 给 出 了 利用 圆 形 结构 元 素 进行 二 值 滤波 的 结果 ,实际 上 形态 学 滤波 处 理 也 可 
以 应 用 于 灰 度 图 像 。 利 用 适当 的 结构 元 素 , 灰 度 开 运 算 可 用 于 图 像 的 某 些 噪声 。 
10.4.2 图 像 细 化 


采 图 像 纲 化 罗 法 得 到 图 牛肉 的 网 兹 结 结构 是 图 像 处 理 中 的 常用 方法 ,将 图 像 细 化 成 
: 形状 表示 法 。 例 如 ,在 进行 字符 识别 前 ,往往 要 先 对 字符 进行 细 
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化 处 理 , 求 出 字符 的 细 化 结构 。 因 此 ,分 析 二 值 图 像 的 细 化 结构 是 图 像 处 理 的 一 个 基本 
问题 ,在 图 像 识 别 或 数据 压缩 时 ,常常 用 到 分 析 图 像 的 细 化 结构 ,骨架 是 目标 图 像 的 重要 
拓扑 描述 ,具有 广泛 的 应 用 。 骨 架 既 可 以 采用 几何 方法 也 可 以 采用 数学 形态 学 方法 
求 出 。 

1. 几何 方法 

图 像 骨 架 形状 的 描述 方法 由 Blum 最 先 提出 ,如 图 10-18 所 示 的 矩形 图 像 , 和 矩形 中 的 虚 
线 为 图 像 的 骨架 。 该 骨架 由 一 条 水 平 线 和 四 根 斜 线 组 成 ,其 中 ,水 平 骨架 由 区 域内 的 同心 圆 
的 圆心 轨迹 构成 。 四 根 斜 线 骨 架 也 可 采用 类 似 的 方法 求 出 ,以 矩形 右上 方 所 示 的 斜 线 骨架 
(右上 方 道 时 钟 45" 虚 线 ) 为 例 , 该 骨架 线 由 一 系列 大 小 不 同 且 与 矩形 右上 角 相 邻 两 矩形 边 
的 内 切 圆 的 圆心 轨迹 组 成 。 


图 10-18 图 像 骨 架 的 示意 图 


2. 形态 学 方法 
除 几何 学 方法 之 外 ,骨架 也 可 以 采用 数学 形态 学 方法 进行 定义 和 求解 。 设 图 像 A 的 骨 
架 用 S(A) 表 示 , 则 图 像 骨 架 可 以 用 腐蚀 和 开 运 算 表示 为 


N 

SCA) = 人 su) (10-25) 
法 = 

Se(A) = (ABkAB) 一 (ABkB)。B (10-26) 


式 中 ,Se(A) 表 示 图 像 A 的 骨架 子 集 ; (ABkB) 表 示 采 用 结构 元 素 B 对 A 进行 连续 
次 腐蚀 运算 ; N 是 指 A 被 腐蚀 为 骨架 之 前 的 最 后 一 次 腐蚀 和 迭代 运算 之 次 数 ,因此 N= 二 max 
{k|AQkB)AG , 

例 10-9: 图 像 骨架 提取 运算 示例 

如 图 10-19(a) 为 包含 汉字 “图像 处 理 ” 的 原始 图 像 ,对 该 图 像 进行 骨架 提取 运算 ,结果 
如 图 10-19(b) 所 示 。 


图 像 处 理 图 像 处 吾 


图 10-19 骨架 提取 算法 
图 像 A 也 可 以 根据 Se(A) 进 行 重 构 , 重 构 公 式 为 


MD 


A=\ {5.(4) 田 妇 ) (10-27) 
上 式 中 的 S; (A)@@kB 表示 采用 结构 元 素 B 连续 NN 次 对 S,(A) 进 行 膨胀 运算 。 
10.4.3 图 像 粗 化 
图 像 粗 化 是 相对 于 图 像 细 化 而 言 的 ,图 像 粗 化 可 以 用 击 中 与 击 不 中 表示 ,图像 粗 化 的 公 


式 为 
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S(A)=AU (AOB) (10-28) 


根据 上 式 可 以 看 出 ,图 像 粗 化 是 原始 图 像 与 击 中 原始 图 像 的 并 集 。 


习题 


ls 
允 


数学 形态 学 具有 哪些 用 途 ? 
若 采用 一 个 半径 为 0. 5cm 的 圆 形 作 为 结构 元 素 ,对 半径 为 2cm 的 圆 进行 腐蚀 和 膨 


胀 运算 ,分 析 其 结果 。 


3. 
. 根据 二 值 膨胀 运算 的 原理 ,给 出 编程 实现 膨胀 运算 的 步骤 。 

. 集合 A 和 结构 元 素 S 的 形状 如 图 10-20 所 示 , 求 用 S 对 A 进行 腐蚀 运算 的 结果 。 
.数学 形态 学 的 基本 运算 腐蚀 膨胀. 开 和 闭 运算 各 有 何 性 质 ? 试 比较 其 异同 。 

. 集合 X 和 结构 元 素 S 的 形状 如 图 10-21 所 示 , 求 用 S 对 X 进行 膨胀 运算 的 结果 。 


A 


8. 
9, 


根据 二 值 腐蚀 运算 的 原理 ,给 出 编程 实现 腐蚀 运算 的 步骤 。 


jf 天 a 


A 
(a) 集合 4 (b) 结构 元 素 8 (a) 集合 X (b) 结构 元 素 8 
图 10-20 集合 A 和 结构 元 素 S 图 10-21 集合 X 和 结构 元 素 S 


试 编写 一 个 程序 ,实现 二 值 图 像 的 腐蚀 、 膨 胀 及 开 、 闭 运算 。 
试 编写 一 个 程序 ,实现 灰 度 图 像 的 腐蚀 、 膨 胀 运算 。 


10. 什么 是 图 像 的 骨架 ? 试 简 述 骨架 提取 的 基本 原理 。 
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CHAPTER 11 


数字 图 像 处 理 按 其 技术 特征 可 以 分 为 三 个 层次 , 即 图 像 处 理 、 图 像 分 析 和 图 像 理 解 与 识 
别 。 无 论 图 像 处 理 、 分 析 还 是 图 像 理 解 与 识别 ,一 般 都 建立 在 图 像 分 割 的 基础 上 ,将 图 像 中 
有 意义 的 特征 或 应 用 所 需要 的 特征 信息 提取 出 来 。 图 像 分 割 的 最 终结 果 是 将 图 像 分 解 成 一 
些 具有 某 种 特征 的 单元 , 称 为 图 像 的 基 元 。 相 对 于 整 幅 图 像 来 说 ,这 种 图 像 基 元 更 容易 被 快 
速 处 理 。 图 像 特 征 是 指 图 像 中 可 用 作 标 志 的 属性 , 它 可 以 分 为 统计 特征 和 视觉 特征 两 类 。 图 
像 的 统计 特征 是 指 一 些 人 为 定义 的 特征 ,通过 变换 才能 得 到 ,如 图 像 的 直方 图 , 矩 .频谱 等 ; 图 
像 的 视觉 特征 是 指 人 的 视觉 可 直接 感受 到 的 自然 特征 ,如 区 域 的 亮度 .纹理 和 轮廓 等 。 

图 像 分 割 是 进行 图 像 分 析 的 关键 步骤 ,也 是 进一步 理解 图 像 的 基础 。 关 于 图 像 分 割 ,每 
年 都 会 发 表 很 多 研究 文章 ,提出 各 种 新 的 图 像 分 割 方法 。 不 同 种 类 的 图 像 ,不 同 的 应 用 要 求 
所 需要 提取 的 特征 是 不 相同 的 ,其 特征 提取 方法 也 就 不 同 ,因此 并 不 存在 一 种 所 谓 普遍 适用 
的 最 优 方法 。 图 像 的 边缘 对 人 类 的 视觉 系统 具有 重要 的 意义 , 它 是 人 类 判别 物体 的 重要 依 
据 , 是 图 像 的 最 基本 特征 。 所 谓 边 缘 ( 又 称 边 沿 ) ,是 指 其 周围 像素 灰 度 有 阶 路 变化 或 屋顶 变 
化 的 那些 像素 的 集合 。 边 缘 广 泛 存在 于 物体 与 背景 之 间 、 物 体 与 物体 之 间 、 基 元 与 基 元 之 
间 。 因 此 , 它 是 图 像 分 割 所 依赖 的 重要 特征 。 
本 章 围绕 图 像 分 割 的 基本 原理 ,介绍 了 常用 的 三 种 图 像 分 割 方法 ,包括 阔 值 分 割 法 、 区 
域 分 割 法 和 基于 边缘 的 分 割 方法 ,同时 还 讨论 了 六 种 常用 的 边缘 检测 算 子 、 轮 廓 提取 方法 和 
图 像 匹配 法 等 图 像 分 析 与 处 理 的 重要 基础 算法 。 


11.1 图 像 分 割 的 基本 概念 


顾名思义 ,图 像 分 割 的 目的 是 将 图 像 划 分 为 若干 具有 一 定 意义 的 或 一 定 目的 的 子 区 域 。 
例如 ,一 幅 航 空 照片 ,可 以 分 割 为 工业 区 、 居 民 区 、 森 林 和 湖泊 等 区 域 。 可 以 逐个 像素 点 为 基 
础 研究 图 像 分 割 ,也 可 以 利用 在 规定 邻 域 中 的 某 些 图 像 信息 进行 分 割 。 分 割 的 依据 一 般 建 
立 在 相似 性 和 非 连续 性 两 个 基本 概念 的 基础 上 。 


11.1.1 图 像 分 割 的 基本 原理 

图 像 分 割 是 根据 图 像 的 组 成 结构 和 应 用 需求 将 图 像 划分 成 若干 个 互 不 相交 的 子 区 域 的 
过 程 ,这 些 子 区 域 是 某 种 意义 下 具有 共同 属性 的 像素 的 连通 集合 。 如 不 同 目标 物体 所 占 的 
图 像 区域 . 前 景 所 占 的 图 像 区 域 等 。 连 通 是 指 集合 中 任意 两 个 点 之 间 都 存在 着 完全 属于 该 
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集合 的 连通 路 径 。 

对 于 数字 图 像 而 言 ,如 图 11-1 所 示 ,连通 包括 4 连通 和 8 连通 两 种 情况 。4 连通 指 的 是 
从 区 域内 一 点 出 发 ,可 通过 4 个 方向 , 即 上 、 下 、 左 、 右 移动 的 组 合 , 在 不 超出 区 域 的 前 提 下 ， 
到 达 区 域内 的 任意 像素 点 ; 8 连通 方法 指 的 是 从 区 域内 一 点 出 发 ,可 通过 左 、 右 、 上 、 下 、 左 
上 、 右 上 、 左 下 、 右 下 这 8 个 方向 的 移动 组 合 来 到 达 区 域内 的 任意 像素 点 。 


(a) 4 连通 (b) 8 连通 
图 11-1 4 连通 和 8 连通 示意 图 


根据 上 述 基 本 概念 ,可 以 给 出 图 像 分 割 的 一 般 性 定义 , 即 图 像 分 割 是 指 将 一 幅 离散 数字 图 
像 信号 fCm,nn) 分 割 为 若干 相 连 的 、 非 空子 区 域 彤 , 户 , 户 ,…… 廊 , 且 满 足 如 下 均一 性 准则 

(1) UfiUfs%…Uf=f。 

(2) Vi, 当 i 二 1,2,3,…,n 时 ,/; 是 连通 区 域 。 

(3) Viyj, 革 ij 时 ,fi 门 [)=2。 

(4) Vfi,P(fi)=True。 

(5) Viyj, 若 ij 时 ,P(fi 门 fj;)==False。 

该 定义 的 条 件 (1) 确 保 一 幅 图 像 经 过 分 割 以 后 ,其 全 部 子 区 域 的 总 和 应 包括 被 分 割 图 像 
的 所 有 像素 , 即 图 像 中 的 每 一 个 像素 都 能 分 割 到 一 个 确定 的 子 区 域 中 。 条 件 (2) 保 证 了 分 割 
的 各 自 区 域内 的 像素 是 连通 的 , 即 分 割 得 到 的 各 子 区 域 应 该 是 一 个 连通 的 小 区 域 。 条 件 (3) 
确保 了 被 分 割 图 像 的 各 个 子 区 域 是 互 不 重生 的 区 域 , 或 者 说 ,被 分 制图 像 的 任何 一 个 像素 不 
能 同时 属于 两 个 或 两 个 以 上 区 域 之 中 。 


11.1.2 图 像 分 割 方法 


图 像 分 割 就 是 把 图 像 分 成 若干 个 特定 的 ,具有 独特 性 质 的 区 域 并 提出 感 兴趣 目标 的 技 
术 和 过 程 , 是 由 图 像 处 理 到 图 像 分 析 的 关键 步骤 。 目 前 已 经 提出 的 图 像 分 割 方法 很 多 ,综合 
各 种 方法 的 实质 , 现 有 的 图 像 分 割 方法 主要 分 以 下 几 种 不 同 的 途径 : 

(1) 基于 阔 值 的 分 割 方法 ,是 一 种 最 常用 的 并 行 区 域 技术 , 它 是 图 像 分 割 中 应 用 数量 最 
多 的 一 类 。 阔 值 分 割 方法 实际 上 是 输入 图 像 到 输出 图 像 基于 某 一 阔 值 的 门限 值 变换 。 

(2) 基于 区 域 的 分 割 方法 ,以 相似 性 原则 作为 分 割 的 依据 , 即 根 据 图 像 的 灰 度 、 色 彩 、 变 
换 关系 或 组 织 结构 等 方面 的 特征 相似 来 划分 图 像 的 子 区 域 ,并 将 各 像素 划 归 到 相应 物体 或 
区 域 的 像素 聚 类 方法 , 即 区 域 法 。 

(3) 基于 边缘 的 分 割 方法 ,边缘 检测 是 图 像 分 割 的 一 种 重要 途径 , 即 检测 灰 度 级 或 者 结 
构 具 有 突变 的 地 方 , 表 明 一 个 区 域 的 终结 ,也 是 另 一 个 区 域 开 始 的 地 方 。 图 像 内 不 同 的 目标 
灰 度 不 同 ,边界 处 一 般 有 明显 的 边缘 ,利用 此 特征 可 以 分 割 图 像 。 

此 外 ,还 有 一 些 基 于 特定 理论 的 分 割 方法 ,从 数学 角度 来 看 ,图 像 分 割 是 将 数字 图 像 划 
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分 成 互 不 相交 的 区 域 的 过 程 ,图 像 分 割 的 过 程 也 是 一 个 标记 过 程 , 即 把 属于 同一 区 域 的 像 索 
赋予 相同 的 编号 。 

这 些 方法 是 互补 的 ,在 有 些 场 合适 宜 应 用 这 一 种 分 割 方法 ,而 另 一 些 场合 则 适宜 采用 另 
一 种 分 割 方法 ,有 时 还 要 将 它们 有 机 地 结合 起 来 ,以 求 得 到 更 好 的 分 割 效 果 。 
对 图 像 分 割 算 法 的 研究 已 有 几 十 年 的 历史 ,目前 基于 各 种 理论 已 提出 了 上 千 种 分 割 算 
法 。 尽 管 人 们 在 图 像 分 割 方面 做 了 许多 研究 工作 ,但 由 于 尚 无 通用 分 制 理论 ,因此 ,这 些 分 
割 算 法 大 都 是 针对 具体 问题 的 ,并 没有 一 种 适合 于 所 有 图 像 的 通用 的 分 割 算 法 。 但 可 以 指 
出 的 是 ,图 像 分 割 方法 正 朝 着 更 快速 ,更 精确 的 方向 发 展 ,通过 各 种 新 理论 和 新 技术 结合 
不 断 取 得 突破 和 进展 。 

虽然 图 像 分 割 没 有 唯一 的 \ 标 准 的 .通用 的 分 割 方法 ,也 没有 一 成 不 变 ,适应 一 切 情 况 的 
所 谓 最 优 分 割 准 则 ,必须 根据 具体 图 像 和 不 同 应 用 目的 而 采用 合适 的 分 割 方法 。 但 在 已 有 
的 图 像 分 割 技 术 中 ,最 常用 的 是 基于 阅 值 处 理 、 基 于 区 域 和 基于 边缘 的 图 像 分 割 方 法 。 


11.2 阅 值 分 割 法 


闵 值 化 分 割 是 一 种 常用 的 ,传统 的 图 像 分 割 方法 ,实现 简单 .计算 量 小 ,性 能 较 稳定 ,目前 
在 图 像 分 割 中 已 成 为 一 种 基本 方法 ,得 到 了 广泛 的 应 用 。 该 分 割 方法 特别 适用 于 目标 和 背景 
占据 不 同 灰 度 级 范围 的 图 像 , 它 不 仅 可 以 极 大 地 压缩 数据 量 , 而 且 也 大 大 简化 了 分 析 和 处 理 步 
又 ,因此 在 很 多 情况 下 ,是 进行 图 像 分 析 、 特 征 提取 与 模式 识别 之 前 的 必要 的 图 像 预 处 理 过 程 。 
常用 的 图 像 分 割 方法 是 把 图 像 藉 度 分 成 不 同 的 等 级 ,然后 用 设置 灰 度 门 限 值 ( 阔 值 的 
方法 确定 有 意义 的 区 域 或 分 割 物体 的 边界 。 常 用 的 阔 值 化 处 理 就 是 图 像 的 二 值 化 处 理 , 即 
选择 一 阔 值 ,将 图 像 转换 为 黑白 二 值 图 像 ,用 于 图 像 分 割 及 边缘 提取 等 处 理 之 中 。 
图 像 闵 值 化 处 理 的 变换 函数 形式 为 
0 f(x) 人 eT 
g(zyy) = Bk (11-1) 
255 f(x,y)>T 
显然 ,图 像 阅 值 化 处 理 是 一 种 阶梯 函数 ,属于 jg 
图 像 灰 度 级 的 非 线 性 运算 ,该 变换 函数 曲线 如 
图 11-2 所 示 。 它 的 功能 是 由 用 户 指定 一 个 阔 值 ， 
如 果 图 像 中 某 个 像素 的 灰 度 值 大 于 该 阔 值 , 则 将 该 
像素 的 灰 度 值 置 为 255 ,否则 将 其 灰 度 值 置 为 0。 : 
阅 值 分 割 的 优点 是 计算 简单 .运算 效率 较 高 、 T 3255 ey 


速度 快 。 对 运算 速度 和 效率 要 求 高 的 应 用 场合 (如 和 


用 于 硬件 实现 ) , 它 得 到 了 广泛 应 用 。 目 前 ,图 像 的 
阔 值 分 割 在 很 多 领域 得 到 了 广泛 应 用 。 例 如 ,在 红外 技术 应 用 中 ,红外 无 损 检测 中 红外 热 图 
像 的 分 割 ,红外 成 像 跟踪 系统 中 目标 的 分 割 ; 在 遥感 图 像 处 理 中 ,常用 于 合成 孔径 雷达 图 像 
对 目标 进行 分 割 ; 在 医学 图 像 中 ,常用 于 血液 细胞 图 像 的 分 割 、 磁 共振 图 像 的 分 割 ; 在 农业 
工程 中 ,水 果品 质 无 损 检 测 过 程 中 水 果 图 像 与 背景 的 分 割 等 。 

采用 图 像 的 阔 值 化 分 割 过 程 中 ,应 合理 选择 阔 值 , 例 11-1 表明 , 阅 值 选取 的 合理 性 对 处 
理 结 果 的 影响 很 大 。 


因 
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例 11-1: 阅 值 分 割 法 实验 

阅 值 分 割 法 的 关键 是 如 何 选 择 阅 值 。 如 图 11-3 所 示 , 对 血液 细胞 图 像 进 行 阅 值 分 割 ， 
图 11-3(a) 为 原始 图 像 , 图 像 中 的 目标 为 细胞 ; 图 11-3(b) 为 原始 图 像 的 灰 度 直方 图 。 分 析 
该 直方 图 可 知 ,该 直方 图 具有 双 峰 特性 ,图 像 中 的 目标 分 布 在 较 暗 的 灰 度 级 上 形成 一 个 波 
峰 ,图 像 背景 分 布 在 较 亮 的 灰 度 级 上 形成 另 一 个 波峰 。 因 此 ,从 理论 上 讲 , 以 直方 图 双 峰 之 
间 的 低谷 处 灰 度 值 作为 阔 值 进行 图 像 的 阔 值 化 处 理 , 便 可 将 目标 和 背景 分 割 开 来 。 
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(b) 灰 度 直方 图 
图 11-3 阅 值 分 割 法 原理 

根据 原始 图 像 的 灰 度 直方 图 ,如 图 11-3Cb) 所 示 ,在 50 一 136 之 间 选 取 不 同 阐 值 进行 分 

割 实验 和 分 割 效果 对 比 。 图 11-4(a) 为 选取 阅 值 T= 二 91 的 分 割 结果 ,图 11-4(b) 为 选取 立 

值 T 王 136 的 分 割 结果 ,图 11-4(c) 为 选取 阅 值 T 王 120 的 分 割 结果 ,图 11-4(d) 为 选取 阅 值 
TT 三 50 的 分 割 结果 。 由 于 选取 了 不 同 的 阔 值 ,图 像 的 分 割 结果 具有 明显 的 差别 。 

hy -= SEE 
oo 本 从 96 三 
© ‘© © DO 8 
0 wec we eg 
人 © Bi 


Se > | a 
(c) =120 (d) T=50 


图 11-4 不 同 阅 值 对 阅 值 化 结果 的 影响 
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根据 该 实验 结果 ,基于 阔 值 的 图 像 分 割 过 程 中 , 若 阔 值 选取 过 大 , 则 会 提取 图 像 的 多 余部 分 ; 
若 阔 值 过 小 , 则 又 会 丢失 所 需 的 部 分 。 因 此 , 阔 值 的 选取 对 图 像 的 分 割 具有 非常 重要 的 作用 。 

当 图 像 灰 度 直 方 图 的 双 峰 特性 不 明显 , 即 图 像 中 的 目标 部 分 和 背景 之 间 亮 度 差 较 小 时 ， 
直接 用 直方 图 就 不 太 容易 确定 一 个 合适 的 阔 值 。 此 时 ,可 用 最 佳 阔 值 法 、 判 别 分 析 法 或 其 他 
合理 的 方法 来 确定 阅 值 。 


11.2.1 最 佳 阐 值 法 


设 图 像 由 物体 和 背景 两 部 分 组 成 ,物体 像素 的 灰 度 级 具有 正 态 概 率 密度 函数 p(z) ,其 
均值 为 ,方差 为 。 背 景 像素 的 灰 度 级 也 具有 正 态 概率 密度 函数 g(x) ,其 均值 为 ,方差 为 
下 。 物 体 占 总 图 像 面 积 的 比例 为 4, 背 景 所 占 面积 比 为 1 一 4, 因 此 ,该 图 像 总 的 灰 度 概率 密 
度 函 数 为 


Mp2 (1 —A) ql(z) 《11-2) 

令 图 像 闷 值 为 1, 并 且 将 小 于 1 的 全 部 点 称 为 目标 物体 点 ,而 将 不 小 于 1 的 全 部 点 称 为 

背景 点 。 那 么 , 设 将 背景 点 错 归 为 物体 点 的 概率 为 Qi (7) ,将 物体 点 错 归 为 背景 点 的 概率 为 
Q: (1) ,因而 有 


QD) =| codz (11-3) 
QW =| pd = 1— pew A} 
总 的 错 分 概率 为 
十 本 一 区 Git 二 [1 一 2 冯 ] 填 疙 一 东 Qi(》 Ki- 
显然 ,使 上 式 最 小 的 冰 值 : 为 最 佳 闵 值 。 因 此 ,对 上 式微 分 可 得 
= = Ci: 雹 
由 于 p01) 和 gq(z) 都 服从 正 态 分 布 ,因而 有 
1 eo 
i = 3 (11-7) 
区 于 
WE (11-8) 
7 二 过 


将 以 上 两 式 代入 式 (11-6) 并 取 自 然 对 数 可 得 

(t—v)’ (t—p)’ 
3 lnr 十 ln < 二 
Lo 

人 一 般 


lnc 十 ln(1 一 人 ) 


ep =o = 20 TIn = 


根据 上 式 , 车 4==0.5,rt 二 a, 则 可 以 得 出 
:= (11-9) 


11.2.2 判别 分 析 法 


判别 分 析 法 确定 最 佳 国 值 的 原则 是 进行 阅 值 处 理 后 ,被 分 离 的 像素 类 之 间 的 类 间 方 差 
最 大 。 判 别 分 析 法 需要 计算 灰 度 直方 图 的 0 阶 窍 和 1 阶 矩 , 它 是 图 像 阅 值 化 处 理 中 常用 的 


出 
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自动 确定 阅 值 的 方法 。 
设 数字 图 像 的 灰 度 级 数 为 工 , 总 像素 数 为 N, 灰 度 值 为 i 的 像素 数 以 N; 表示 , 则 灰 度 级 
为 的 灰 度 分 布 的 0 阶 矩 及 1 阶 矩 的 定义 分 别 如 下 : 


0 阶 矩 为 
大 
N 
(CO 一 >) 站 (11-10) 
Ww 之 N 
1 阶 矩 为 
大 - 
w(k) = D3 (11-11) 


当 & 一 工 一 1 时 ,w(L 一 1) 二 1; jy(L 一 1) 二 pa ,其 中 ,pa 为 图 像 的 平均 灰 度 值 。 
设 图 像 的 M 一 1 个 阅 值 为 0 二 ki 过 过 二 … 过 kui 三 L 一 1, 将 图 像 分 割 成 M 个 灰 度 
值 的 类 C; 
CELk tl ,ki] ko=0,ky=L,j=1,2,3,.…,M 
则 各 类 Ci 的 发 生 概率 为 
wi = wk;) — wlkj1) 
而 相应 的 概率 平均 值 为 
前 三 ED (11-12) 
其 中 
w(0) 一 0， Hp(0) 一 0 


因此 ,可 得 各 类 的 类 间 方 差 为 
一 1 
到 (外 让 ea ) = Dy (万 一 和 


将 使 上 式 的 0 值 为 最 大 的 阔 值 组 (Ai ,ks ,ks，,… ,kw-1) 作 为 M 值 化 的 最 佳 阅 值 组 。 若 
分 割 成 2 类 , 即 取 M 为 2, 则 可 求 出 二 值 化 的 阔 值 。 

对 于 复杂 图 像 , 在 许多 情况 下 对 整 幅 图 像 用 单一 阅 值 不 能 给 出 理想 的 分 割 结果 。 例 如 ， 
车 为 光亮 背景 上 的 暗 物 体 图 像 , 由 于 照射 光 的 不 均匀 ,虽然 物体 与 背景 始终 有 反差 ,但 在 图 
像 的 某 一 部 分 物体 和 背景 都 比 另 一 部 分 亮 。 因 此 ,在 图 像 的 一 部 分 能 把 物体 和 背景 精确 地 
分 开 的 阔 值 ,对 另 一 部 分 而 言 , 可 能 会 把 太 多 的 背景 也 作为 物体 进行 分 割 。 克 服 这 一 缺点 有 
如 下 一 些 方法 : 如 果 已 知 图 像 上 的 位 置 函数 用 来 描述 不 均匀 照射 , 则 可 以 先 设法 应 用 灰 度 
级 校正 方法 进行 校正 ,然后 采用 单一 阅 值 进行 分 割 ; 另 一 种 方法 是 将 图 像 分 成 子 区 域 ,对 每 
一 子 区 域 设 置 局 部 阔 值 。 但 是 ,如 果 某 一 子 区 域 仅 仅 含 有 物体 或 仅 有 背景 ,那么 该 子 区 域 就 
找 不 到 阅 值 。 这 时 ,可 以 根据 邻近 子 区 域 的 局 部 阅 值 通过 内 插 法 求 得 该 子 区 域 的 一 个 阅 值 。 

在 确定 阐 值 时 ,如 果 阅 值 过 高 .偶然 出 现 的 物体 像素 点 就 会 被 认 作 背景 ; 如 果 阅 值 过 
低 , 则 会 发 生 相反 的 情况 。 克 服 这 种 情况 的 方法 是 使 用 两 个 闵 值 。 例 如 ,4 二 ts ,将 灰 度 值 超 
过 4 的 像素 分 类 为 核心 物体 点 ,而 灰 度 值 超过 4 的 像素 , 仅 当 它们 紧 靠 核心 物体 点 时 才 认 
为 是 物体 点 。is 的 选择 要 使 每 个 物体 有 一 些 像素 灰 度 级 高 于 ,而 背景 不 含有 这 样 的 像素 。 
同时 ,应 选择 使 每 个 物体 像素 点 具有 高 于 w 灰 度 级 。 如 果 只 使 用 i,, 则 物体 总 是 分 割 得 
不 完整 ; 如 果 只 使 用 4 , 则 会 有 许多 背景 像素 被 错 分 为 物体 像素 。 但 是 ,如 果 同 时 使 用 和 
ts 两 个 值 就 能 把 背景 与 物体 很 好 地 分 割 开 来 。 当 然 , 如 果 物 体 与 背景 的 对 比 是 鲜明 的 ,就 不 
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必 使 用 这 种 方法 。 

此 外 ,如 果 存 在 一 个 靖 值 1; ,使 得 每 个 物体 的 像素 灰 度 级 高 于 is ,而 背景 不 包含 这 种 像 
素 , 可 对 图 像 设 置 闵 值 ,然后 检查 高 于 冰 值 像素 的 区 域 ,目的 是 寻找 一 个 局 部 阅 值 ,以 便 在 
每 个 类 似 区 域 中 把 物体 和 背景 分 开 。 如 果 这 些 物体 相当 小 ,并 且 不 太 靠 近 在 一 起 时 ,这 种 方 
法 比较 适用 。 所 使 用 的 区 域 应 足够 大 ,以 保证 它们 既 包含 物体 像素 ,也 包含 背景 像素 ,这 样 
就 可 以 使 区 域 的 直方 图 是 双 峰 的 。 

有 时 需要 寻找 一 幅 图 像 的 局 部 最 大 点 , 即 提 取 比 附近 像素 有 较 高 的 某 种 局 部 性 质 值 的 
像素 。 一 般 来 讲 , 也 要 求 这 些 点 具有 高 于 一 个 低 阔 值 的 值 ,一 旦 超过 4, 不管 它 的 绝对 值 
大 小 如 何 , 一 切 相对 的 最 大 值 都 被 采纳 。 因 此 ,可 把 寻找 局 部 最 大 值 看 作为 局 部 设置 阔 值 的 
极端 情况 。 在 对 图 像 进行 匹配 运算 或 检测 界线 时 可 采用 这 种 方法 。 


11.3 区 域 分 割 法 


基于 区 域 的 图 像 分 割 方法 主要 包括 区 域 生 长 和 区 域 分 裂 与 合并 两 种 典型 的 方法 。 区 域 
生长 法 是 从 单个 像素 出 发 ,逐渐 合并 周围 像素 ,最 后 形成 所 需要 的 分 割 结果 ; 分 裂 与 合并 法 
是 从 整 幅 图 像 出 发 ,逐渐 分 裂 或 者 合并 ,最 后 形成 所 需要 的 分 割 结果 。 


11.3.1 区 域 生长 法 


图 像 分 割 的 目的 是 将 一 幅 图 像 划 分 成 一 些 子 区 域 ,因此 ,最 直接 的 方法 就 是 将 一 幅 图 像 
分 成 满足 某 种 判 据 的 子 区 域 , 也 就 是 说 ,将 点 组 成 区 域 。 为 了 实现 分 组 ,首先 需要 确定 子 区 
域 的 数目 ,其 次 要 确定 一 个 各 子 区 域 相互 区 别 的 特征 ,最 后 还 要 产生 有 意义 分 割 的 相似 性 
判 据 。 

将 图 像 分 割 成 子 区 域 的 一 种 方法 叫 区 域 生 长 或 区 域 生成 法 ,其 基本 思想 是 将 图 像 中 满 
足 某 种 相似 性 准则 的 像素 点 集合 起 来 构成 区 域 。 具 体 先 对 每 个 需要 分 割 的 区 域 找 一 个 种 子 


据 某 种 事先 确定 的 生长 或 相似 准则 来 判定 ) 合 并 到 种 子 像素 所 在 的 区 域 中 。 将 这 些 新 像素 
当 作 新 的 种 子 像素 继续 进行 上 面 的 过 程 , 直 到 再 没有 满足 条 件 的 像素 可 被 包括 进来 。 这 样 
一 个 区 域 就 长 成 了 。 

假定 子 区 域 的 数目 以 及 在 每 个 子 区 域 中 单个 点 的 位 置 已 知 , 则 从 一 个 像素 点 (种 子 点 ) 
开始 ,在 各 个 方向 上 ,如 4 邻 域 或 8 邻 域 向 外 扩展 以 生成 子 区 域 。 相 似 性 准则 可 以 是 灰 度 
级 .彩色 组织、 梯度 或 其 他 特性 ,相似 性 测度 可 以 根据 所 确定 的 阐 值 来 判定 。 方 法 是 从 满足 
检测 准则 的 点 开始 ,在 各 个 方向 上 生长 子 区 域 , 当 其 邻近 点 满足 检测 准则 就 并 入 小 块 区域 
中 。 当 新 的 点 被 合并 后 再 用 新 的 子 区 域 重复 这 一 过 程 ,直到 没有 可 接受 的 邻近 点 时 生成 过 
程 便 终 止 。 

例 11-2: 简单 区 域 生长 示例 

本 示例 是 区 域 生长 法 的 一 个 算法 实例 ,如 图 11-5 所 示 , 图 像 中 的 种 子 像素 点 和 被 合并 
的 像素 点 均 用 下 划 线 标 出 。 其 中 图 11-5(a) 是 输入 图 像 ,像素 点 9 作为 种 子 像素 点 ,此 例 的 
相似 性 准则 是 邻近 点 的 灰 度 级 与 物体 的 平均 灰 度 级 的 差 小 于 2。 图 中 被 接受 的 点 和 起 始点 
均 用 下 划 线 标 出 ,图 11-5(b) 是 区 域 生 长 的 第 一 步 所 得 到 的 生长 区 域 ; 图 11-5(c) 是 第 二 步 
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接受 的 邻近 点 ,其 种 子 像素 点 的 灰 度 值 是 图 11-5(b) 中 所 得 到 的 生长 区 域 的 灰 度 平均 值 ; 
图 11-5(d) 是 从 像素 点 6 开始 生成 的 结果 。 


要 过 8 6 5 5 8 6 
4|sg|9 17 4|8|9 | 
2 多 8 3 2 2 8 i 
3 3 3 3 3 汪 3 3 
(a) (b) 
§ | 总 s | 56 5|| sl 
4|s|。，|3 a#|s| | 
2 |2 s |3 2|2|s|s 
3 | 于 | 写 | 3 医 到 区 避 医 
(© dd) 


图 11-5 区 域 生长 示例 


当 生成 任意 物体 时 ,接收 准则 可 以 结构 为 基础 ,而 不 是 以 灰 度 级 或 对 比 度 为 基础 。 为 了 
将 候选 的 小 群 点 包含 在 物体 中 ,可 以 对 这 些小 群 点 进行 检测 ,而 不 是 检测 单个 点 ,如 果 它 们 
的 结构 与 物体 的 结构 足够 相似 时 就 接受 它们 。 

实际 应 用 中 ,需要 注意 如 下 问题 : 

(1) 确定 图 像 中 待 分 割 区 域 的 数目 并 确定 每 一 区 域 的 种 子 点 ,种 子 点 一 般 可 以 根据 具 
体 的 问题 和 专家 经 验 进 行 选取 ,并 没有 一 个 统一 的 准则 。 

(2) 相似 性 度量 准则 的 确定 。 度 量 准 则 的 确定 是 区 域 生长 的 关键 , 既 可 以 选取 灰 度 级 
为 度量 准则 ,也 可 以 选取 图 像 的 结构 纹理 等 非 灰 度 级 准则 ,其 选取 一 般 依赖 于 具体 的 分 割 
目的 。 

(3) 区 域 生长 法 的 优点 是 简单 方便 ,但 由 于 仅 考虑 了 从 一 个 像素 点 到 另 一 个 像素 点 的 
特性 是 否 相 似 , 因 此 对 于 有 噪声 或 某 些 复杂 的 图 像 , 应 用 该 方法 可 能 会 引起 一 些 不 希望 的 区 
域 出 现 。 


11.3.2 区域 分 裂 与 合并 


区 域 生 长 是 从 图 像 的 某 个 或 者 某 些 像素 点 出 发 ,最 后 得 到 整个 区 域 ,进而 实现 目标 提 
取 。 分 裂 与 合并 法 某 种 意义 上 是 区 域 生 长 的 逆 过 程 : 它 是 从 整个 图 像 出 发 ,不 断 分 裂 得 到 
各 个 子 区 域 ,然后 再 将 前 景区 域 合并 ,实现 目标 提取 。 分裂 合并 的 假设 是 对 于 一 幅 图 像 , 前 
景区 域 由 一 些 相互 连通 的 像素 组 成 ,因此 ,如 果 把 一 幅 图 像 分 裂 到 像素 级 ,那么 就 可 以 判定 
该 像素 是 否 为 前 景 像素 。 当 所 有 像素 点 或 者 子 区 域 完成 判断 以 后 ,把 前 景区 域 或 者 像素 合 
并 就 可 得 到 前 景 目标 。 

另 一 种 方法 是 在 开始 时 将 图 像 分 割 为 一 系列 任意 不 相交 的 区 域 , 然 后 将 它们 进行 聚合 
或 拆 分 以 满足 条 件 , 即 分 离 与 合并 的 区 域 分 析 法 ,又 称 为 区 域 分 离 与 聚合 法 。 该 方法 的 基本 
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原理 是 利用 图 像 数 据 的 金字 塔 或 四 又 树 数据 结构 的 层次 概念 ,将 图 像 分 为 一 组 任意 不 相交 
的 区 域 , 即 可 以 从 图 像 的 这 种 金字 塔 或 四 又 树 结构 的 任意 中 间 层 开始 ,根据 给 定 的 均匀 性 检 
测 准则 进行 分 裂 和 合并 这 些 区 域 ,逐步 改善 这 些 区 域 的 性 能 ,直到 最 后 将 图 像 分 为 数量 最 少 
的 区 域 为 止 。 

令 RR 表示 整 幅 图 像 区 域 并 选择 一 个 均匀 性 准则 万 。 对 R 进行 分 割 的 一 种 方法 是 反复 
将 分 割 得 到 的 结果 图 像 再 次 分 为 4 个 区 域 ,直到 对 任何 区 域 Ri, 有 五 (R,) 王 True。 可 以 从 
整 幅 图 像 开始 。 如 果 玉 (R) 二 False, 就 将 图 像 分 割 为 4 个 区 域 。 对 任何 区 域 如 果 五 的 值 是 
False, 就 将 这 4 个 区 域 的 每 个 区 域 再 次 分 为 4 个 区 域 ,如 此 不 断 继续 下 去 。 如 图 11-6 所 
示 , 这 种 特殊 的 分 割 技术 可 以 方便 地 用 四 又 树 (每 个 非 叶子 节点 有 4 个子 树 ) 形 式 表示 ,其 
中 , 树 的 根 对 应 于 整 幅 图 像 ,每 个 节点 对 应 于 划分 的 子 区 域 ,这 里 ,只 有 R, 进行 了 进一步 的 
再 分 。 

如 果 仅 使 用 拆 分 ,最 后 的 分 区 可 能 会 包含 具有 相同 性 质 的 相 邻 区 域 。 这 一 不 足 可 以 通 
过 在 进行 拆 分 的 同时 ,也 允许 进行 区 域 聚合 来 予以 纠正 ,限制 条 件 仅 需 要 将 相 邻 区 域 进行 聚 
合 ,但 聚合 的 不 同 区域 中 相互 连接 的 像素 必须 满足 均匀 性 准则 五 , 即 只 有 在 H(R,UR;)= 
True 时 ,两 个 相 邻 的 区 域 R 和 R 才 可 以 聚合 。 

因此 ,分 裂 聚合 过 程 可 以 总 结 为 如 下 步骤 : 

(1) 确定 均匀 性 准则 瓦 ,将 原始 图 橡 构成 如 图 11-6 所 示 的 四 又 树 结构 。 

(2) 对 于 任何 区 域 RR, ,如果 五 (R,) 王 False, 就 将 每 个 区 域 拆 分 为 4 个 相连 的 区 域 。 

(3) 将 有 (RiUR;) 二 True 的 任意 两 个 相 邻 区 域 Re 和 尺 ) 进 行 聚 合 。 

(4) 当 无 法 进行 进一步 聚合 或 拆 分 时 终止 。 


RI R 


Ry | Ra 
及 


Ra Ry 


Ry Ra Ra Ra 
(a) 被 分 裂 的 图 像 (b) 四 又 树 表示 


图 11-6 图 像 的 分 裂 聚合 四 叉 树 结构 


分 裂 与 合并 法 的 关键 是 分 裂 合并 准则 的 设计 。 这 种 方法 对 复杂 图 像 的 分 割 效果 较 好 ， 
但 算法 较 复杂 ,计算 量 大 ,分 裂 还 可 能 破坏 区 域 的 边界 。 

可 以 对 前 面 讲述 的 基本 思想 进行 一 些 适当 的 变化 。 例 如 ,一 种 变化 方案 是 开始 时 将 图 
像 拆 分 为 一 组 图 像 子 块 。 然 后 对 每 个 子 块 进一步 进行 上 述 拆 分 ,但 聚合 操作 开始 时 具有 一 
定 的 限制 , 即 只 能 将 4 块 并 为 一 组 。 这 4 块 是 四 又 树 表示 法 中 节点 的 后 代 且 都 满足 均匀 性 
准则 互 。 当 不 能 再 进行 此 类 聚合 时 ,这 个 过 程 终 止 于 满足 步骤 3 的 最 后 的 区 域 聚合 。 在 这 
种 情况 下 ,聚合 的 区 域 可 能 会 大 小 不 同 。 这 种 方法 的 主要 优点 是 对 于 拆 分 和 聚合 都 使 用 同 
样 的 四 又 树 ,直到 聚合 的 最 后 一 步 。 
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11.4 边缘 检测 的 基本 原理 


图 像 分 割 的 另 一 种 重要 途径 是 通过 边缘 检测 , 即 检测 灰 度 级 或 者 一 幅 图 像 中 结构 具有 
突变 的 地 方 ,表明 一 个 区 域 的 终结 ,也 是 另 一 个 区 域 开始 的 地 方 。 这 种 不 连续 性 称 为 边缘 。 
图 像 内 不 同 的 物体 灰 度 不 同 ,一般 有 明显 的 边缘 ,利用 此 特征 可 以 分 割 图 像 。 

图 像 内 边缘 处 像素 的 灰 度 值 不 连续 ,这 种 不 连续 性 可 通过 求 导 数 检测 。 对 于 阶 跃 类 型 
的 边缘 ,其 位 置 对 应 一 阶 导数 的 极 值 点 ,对 应 二 阶 导 数 的 过 零点 。 因 此 常用 微分 算 子 进行 边 
缘 检测 。 常 用 的 一 阶 微分 算 子 有 Robert 算 子 和 Sobel 算 子 ,二 阶 微分 算 子 有 Laplace 算 子 
和 Kirsh 算 子 等 。 实 际 应 用 时 各 种 微分 算 子 常用 模板 来 实现 , 即 微 分 运算 是 利用 模板 和 图 
像 卷 积 实现 的 。 这 些 算 子 对 噪声 敏感 ,只 适合 于 噪声 较 小 不 太 复杂 的 图 像 。 

由 于 边缘 和 噪声 都 是 灰 度 不 连续 点 ,从 频 域 的 概念 分 析 都 是 高 频 分 量 ,直接 使 用 微分 可 
能 容易 受 噪 声 的 影响 。 为 了 降低 噪声 的 影响 ,用 微分 算 子 检测 边缘 前 应 对 图 像 进行 平滑 滤 
波 。LoG 算 子 和 Canny 算 子 是 具有 平滑 功能 的 二 阶 和 一 阶 微分 算 子 ,边缘 检测 效果 较 好 。 
其 中 LoG 算 子 是 采用 Laplace 算 子 求 高 斯 函数 的 二 阶 导 数 ,Canny 算 子 是 高 斯 函数 的 一 阶 
导数 , 它 在 噪声 抑制 和 边缘 检测 之 间 取 得 了 较 好 的 平衡 。 


11.4.1 边缘 与 边缘 信号 


物体 的 边缘 无 论 是 对 人 类 的 视觉 系统 还 是 对 数字 图 像 处 理 技术 
都 具有 非常 重要 的 意义 , 它 是 图 像 的 基本 特征 。 根 据 Marr 的 视觉 计 
算 理论 框架 ,提取 二 维 图 像 物 体 上 的 边缘 、 角 点 ,纹理 等 基本 特征 是 整 
个 系统 框架 的 第 一 步 , 这 些 特征 所 组 成 的 图 称 为 基 元 图 。 边 缘 中 包含 图 11.7 物体 边缘 的 
图 像 物 体 有 价值 的 边界 信息 ,这 些 信息 可 以 用 于 图 像 分 析 、 滤 波 以 及 作用 

目标 识别 ,并 且 通过 边缘 检测 可 以 极 大 地 降低 后 续 图 像 分 析 处 理 的 数 

据 量 。 边 缘 存 在 于 目标 与 背景 目标 与 目标 .区 域 与 区 域 . 基 元 与 基 元 之 间 。 如 图 11-7 所 
示 , 仅 仅 根据 一 幅 图 像 的 边缘 点 ,就 能 识别 出 三 维 物体 ,可 见 边缘 点 确实 包含 了 图 像 中 的 大 
量 有 用 信息 。 


11.4.2 边缘 的 类 型 


尽管 边缘 在 数字 图 像 处 理 和 分 析 中 具有 重要 作用 ,但 是 到 目前 为 止 ,还 没有 关于 边缘 的 
被 广泛 接受 和 认可 的 精确 的 数学 定义 。 一 方面 是 因为 图 像 的 内 容 非常 复杂 ,很 难 用 纯 数 学 
的 方法 进行 描述 , 另 一 方面 则 是 因为 人 类 对 本 身 感 知 目 标 边界 的 高 层 视觉 机 理 的 认识 还 处 
于 完善 之 中 。 
目前 ,具有 对 边缘 的 描述 性 定义 , 即 两 个 具有 不 同 灰 度 的 均匀 图 像 区 域 的 边界 , 即 边界 
映 局 部 的 灰 度 变 化 。 局 部 边缘 是 图 像 中 局 部 灰 度 级 以 简单 ( 即 单调 ) 的 方式 作 极 快 变换 的 
区 域 。 这 种 局 部 变化 可 用 一 定 窗口 运算 的 边缘 检测 算 子 来 检测 。 边 缘 的 描述 包含 以 下 几 
个 方面 : 
(1) 边缘 法 线 方向 
(2) 边缘 方向 


学 河 


在 某 点 灰 度 变化 最 剧烈 的 方向 ,与 边缘 方向 垂直 。 
与 边缘 法 线 方向 垂直 ,是 目标 边界 的 切线 方向 。 
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(3) 边缘 强度 一 一 沿边 缘 法 线 方向 图 像 局 部 的 变化 强度 的 量度 。 

一 般 认 为 沿边 缘 方 向 的 灰 度 变化 比较 平缓 ,而 边缘 法 线 方 4 
向 的 灰 度 变化 比较 剧烈 。 图 像 上 的 边缘 点 可 能 对 应 不 同 的 物 
理 意 义 。 如 图 11-8 所 示 ,图 像 上 的 边缘 点 包括 以 下 几 种 情况 。 

(1) 空间 曲面 上 的 不 连续 点 。 如 标 为 A 的 边缘 线 , 这 些 
边缘 线 为 两 个 不 同 曲面 或 平面 的 交 线 ,该 点 处 物体 表面 的 法 
线 方向 不 连续 ,在 A 类 边缘 线 的 两 边 ,图 像 的 灰 度 值 有 明显 
的 不 同 。 

(2) 物体 与 背景 的 分 界线 。 图 中 标注 为 B 的 边缘 线 是 物 图 11-8 图 像 中 的 各 类 边缘 
体 与 背景 的 分 界线 ,如 图 中 圆柱 上 有 两 条 B 类 边缘 线 ,这 类 边 
缘 线 一 般 称 为 外 轮廓 线 。 在 已 类 边缘 点 上 ,三 维 物体 表面 的 法 线 方向 是 连续 的 ,出 现 边 缘 
点 是 由 于 从 一 定 视角 看 物体 时 ,B 类 边界 点 是 物体 与 背景 的 交界 处 。 由 于 物体 与 背景 在 光 
照 条 件 与 材料 反射 系数 等 方面 存在 较 大 差异 ,因此 在 B 类 边缘 两 侧 , 图 像 的 灰 度 也 有 很 大 
差异 。 图 中 标注 B 的 边缘 是 物体 与 背景 的 交界 处 ,因此 ,边缘 B 是 物体 上 表面 法 线 的 不 连 
续 处 。 但 边缘 B 引起 了 两 侧 灰 度 的 跃 变 。 

(3) 不 同 材料 组 成 的 边缘 线 。 图 中 标注 为 C 的 边缘 线 是 由 不 同 材料 或 相同 材料 不 同 颜 
色 所 产生 的 。 图 中 桌面 由 两 种 不 同 材 料 构成 ,由 于 它们 对 光 的 反射 系数 不 同 , 使 边缘 线 C 的 
两 侧 灰 度 具 有 明显 差别 。 

(4) 阴影 引起 的 边缘 。 图 中 标注 为 了 的 边缘 线 是 由 于 阴影 引起 的 边缘 。 由 于 物体 表面 
某 一 部 分 被 男 一 物体 遮挡 ,使 它 得 不 到 光源 的 照射 或 照射 不 充分 ,从 而 引起 边缘 点 两 侧 灰 度 
值 有 较 大 的 差异 。 


11.4.3 典型 边缘 信号 


尽管 图 像 边缘 点 产生 的 原因 各 不 相同 ,但 它们 都 是 图 像 上 灰 度 不 连续 或 灰 度 急 剧变 化 
的 点 ,虽然 这 么 说 有 些 模糊 ,因此 需要 定义 一 个 相对 准确 的 边缘 数学 模型 。 根 据 信 号 理论 ， 
基本 的 灰 度 变化 可 以 抽象 为 阶 路 形 或 者 脉冲 形 等 形式 ,如 图 11-9(a) 所 示 是 一 种 阶 路 信号 ， 
这 时 可 以 认为 A 点 处 为 边缘 点 。 在 实际 图 像 中 ,光照 信号 不 可 能 有 完全 理想 的 突变 ,而 可 
能 是 如 图 11-9(b) 所 示 的 逐渐 增 大 的 渐变 信号 ,对 图 11-9(b) 中 所 示 A、B、C 三 点 ,一 般 定 
义 BB 点 为 边缘 点 。 在 图 11-9(c) 中 ,如 果 台 阶 比较 窗 , 即 可 以 认为 B 点 为 边缘 点 ,也 可 以 认 
为 该 信号 有 两 个 边缘 点 A 与 C。 这 些 只 是 理想 的 情况 ,考虑 到 图 像 是 二 维 的 ,而 且 往 往 图 
像 上 县 加 有 噪声 ,因此 实际 图 像 的 灰 度 变化 情况 要 复杂 得 多 。 


图 11-9 图 像 中 的 各 类 边缘 信号 
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11.5 边缘 检测 算 子 


图 像 中 灰 度 值 或 色彩 急剧 变化 之 处 , 即 为 物体 的 边缘 ,在 灰 度 值 变换 比较 剧烈 之 处 进行 
微分 运算 ,就 可 以 得 出 区 别 于 其 他 处 的 较 大 数值 ,因此 ,可 以 利用 各 种 微分 运算 进行 边缘 检 
测 。 边 缘 检 测算 子 就 是 通过 检查 每 个 像素 点 的 邻 域 并 对 其 灰 度 变化 进行 量化 来 达到 边界 提 
取 的 目的 ,而 且 大 部 分 的 检测 算 子 还 可 以 确定 边界 变化 的 方向 。 前 述 章节 中 所 讨论 的 各 种 
基于 微分 的 图 像 锐 化 算法 都 可 以 用 于 图 像 的 边缘 检测 ,也 就 是 说 ,用 各 种 锐 化 模板 对 图 像 进 
行 卷 积 运 算 , 便 可 检测 出 图 像 的 边缘 。 


11.5.1 一 阶 微分 算 子 


一 阶 微分 算 子 主要 有 罗伯特 (Robert) 算 子 、 索 贝尔 (Sobel) 算 子 . 普 瑞 维特 (Prewitt) 算 
子 和 凯 西 (Kirsch) 算 子 ,一 般 借助 空域 微分 和 卷 积 模板 完成 ,对 于 数字 图 像 ,以 差分 近似 微 
分 来 进行 运算 。 

1. Robert 算 子 

罗伯特 (Robert) 边 缘 检 测算 子 是 一 种 利用 局 部 差分 方法 寻找 边缘 的 算 子 ,于 1963 年 提 
出 ,是 第 一 个 边缘 检测 算 :边缘 检测 中 得 到 了 广泛 应 用 。Robert 梯度 算 子 所 采用 的 是 
对 有 角 方 向 相 邻 两 像素 值 之 差 , 算 子 形式 为 

Mf(mny = fl 


Asf (zsy) = f(x—1,y)— f(r,y—1) a 
上 述 算 子 对 应 的 两 个 2X2 模板 如 图 11-10 
所 示 。 ;用 中 ,图像 中 的 每 个 像素 点 都 用 这 | a . 
两 个 模板 ,为 避免 出 现 负 值 ,在 边 | 本 本 0 


缘 检测 时 常 取 其 绝对 值 。 (a) (b) 

例 11-3: Robert 边缘 检测 算 子 示例 图 11-10 “Robert 算 子 模板 

采用 Robert 算 子 对 lena 图 像 进 行 边缘 检 
测 ,如 图 11-11(a) 所 示 为 原始 图 像 ,图 11-11(b) 为 采用 Robert 算 子 对 图 11-11(a) 进 行 边缘 
仿 测 的 结果 。 


(a) 原始 图 像 (b) Robert 算 子 检测 结果 


图 11-11 Robert 算 子 边缘 检测 结果 
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Robert 算 子 是 利用 局 部 差分 算 子 寻找 边缘 的 算 子 ,采用 对 角 线 方向 相 邻 两 像素 之 差 近 
似 梯 度 幅 值 检 测 边缘 ,检测 垂直 边缘 的 效果 好 于 和 斜 向 边缘 。 实 验 表 明 ,Robert 对 噪声 敏感 ， 
无 法 抑制 噪声 的 影响 , 算 子 定位 精度 与 噪声 有 关 , 对 具有 陡峭 边缘 的 低 噪声 图 像 有 很 好 的 
2. Sobel 算 子 
索 贝 尔 (Sobel) 边 缘 算 子 所 采用 的 算法 是 先进 行 加 权 平 均 , 然 后 进行 微分 运算 。 算 子 的 
计算 方法 为 
Asf (zsy) = 一 [Fz 一 ly 二 1) 十 2fCzy 十 1) 十 FCz 十 1,y 十 1)] 一 
[LA 一 1 一 防 二 2712 一 仿 十 六 羡 十 1 7 一 1] 
Ayf (zy) = [pz 一 1l,y 一 1) 十 2F(z 一 1,y) 十 FGz 一 1,y 十 1)] 一 
[FPCz 十 ly 一 1) 十 21z 十 1 十 jz 十 1 十 1)] 
Sobel 算 子 垂直 方向 和 水 平方 向 的 模板 如 图 11-12 所 示 ,前 者 可 以 检测 出 图 像 中 的 水 平 
方向 的 边缘 ,后 者 则 可 以 检测 图 像 中 垂直 方向 的 边缘 。 实 际 应 用 中 ,每 个 像素 点 取 两 个 模板 


卷 积 的 最 大 值 作 为 该 像素 点 的 输出 值 ,运算 结果 是 一 幅 边 缘 图 像 。 


(11-14) 


-1 -2 -1 -1 0 1 

0 0 0 -2 0 2 

1 2 1 -1 0 1 
(a) (b) 


图 11-12 Sobel 算 子 模板 


例 11-4: Sobel 边缘 检测 算 子 示例 
本 示例 依然 采用 lena 图 像 进行 边缘 检测 ,图 11-13 
所 示 是 用 Sobel 算 子 对 图 11-11(a) 进行 边缘 检测 的 
结果 。 
实验 结果 表明 ,Sobel 算 子 具有 一 定 的 噪声 抑制 能 
力 ,在 检测 渐变 和 噪声 较 多 的 图 像 时 具有 相对 良好 的 
效果 ,定位 精度 较 好 ,检测 阶 跃 边缘 时 可 以 得 到 至 少 两 
个 像素 的 边缘 宽度 。 
3. Prewitt 算 子 
普 瑞 维特 (Prewitt) 边 缘 检 测算 子 是 一 种 利用 局 部 
差分 平均 方法 寻找 边缘 的 算 子 , 它 体 现 了 3 对 像素 点 像 ”图 11-13 Sobel 算 子 边缘 检测 结果 
素 值 之 差 的 平均 概念 , 算 子 形式 为 
Aftray) = [f(z ly+ D+ Fr Dt Fr — sy+1)] 
[flz+1lsy—D+f(rsy—l)+f(z—1,y—1)] 
Ayf (zsy) = [fz—1lsy— D+f (rly i frm1l,yt+1)]— 
WD ee 0 Be Rh 
Prewitt 边缘 检测 算 子 的 两 个 模板 如 图 11-14 所 示 , 它 的 使 用 方法 同 索 贝尔 算 子 一 样 ， 
得 到 的 结果 也 是 一 幅 边缘 图 像 。 


(11-153 
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一 1 -l 一 1 0 -1 
0 0 0 1 0 一 1 
1 1 1 1 0 -] 
(a) (b) 
图 11-14 Prewitt 算 子 模板 


例 11-5: Prewitt 边缘 检测 算 子 示例 

对 Prewitt 算 子 依然 采用 lena 图 像 进 行 实验 ， 
图 11-15 所 示 是 应 用 Prewitt 算 子 对 图 11-11(a) 进 行 边 
缘 检 测 的 结果 。 

Prewitt 算 子 也 是 利用 一 阶 微分 运算 边缘 检测 ,其 


原理 是 在 图 像 空间 利用 两 个 方向 模板 与 图 像 进行 邻 域 
卷 积 来 完成 的 ,这 两 个 方向 模板 一 个 检测 水 平 边缘 ,一 
个 检测 垂直 边缘 。 本 实验 表明 ,Prewitt 算 子 对 噪声 具 
有 抑制 作用 ,可 去 掉 部 分 伪 边 缘 , 对 于 灰 度 渐变 和 噪声 
较 多 的 图 像 具 有 相对 好 的 效果 。 
4. Kirsch 算 子 图 11-15 Prewitt 算 子 边缘 检测 结果 
凯 西 (Kirsch) 边 缘 检 测算 子 需要 求 出 /(z,y)8 个 
方向 的 平均 差分 的 最 大 值 , 其 8 个 方向 模板 如 图 11-16 所 示 ,该 算 子 可 以 检测 出 边缘 的 方向 
性 信息 ,并 能 较 好 地 抑制 边缘 检测 的 噪声 。 
-3 0 -3 
(a) 
要 -3 5 -3 -3 -3 
-3 0 5 -3 0 5 
-3 -3 3 -3 > 5 
(© (d) 
-3 -3 -3 -3 -3 -3 
-3 0 一 3 0 -3 
$ 多 全 5 5 —3 
(e) 人 
5 -3 -3 才 § 一 3 
5 0 -3 5 0 -3 
5 -3 -3 -3 -3 -3 
(g) (h) 


图 11-16 Kirsch 算 子 模板 
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例 11-6: Kirsch 边缘 检测 算 子 示例 
然 lena 图 像 进 行 实验 ,图 11-17 所 示 是 应 用 
Kirsch 算 子 对 图 11-11(a) 进 行 边 缘 检 测 的 结果 。 
Kirsch 算 子 是 R. Kirsch 提出 来 的 一 种 边缘 检测 算 
法 , 它 采用 8 个 3X3 的 模板 对 图 像 进行 卷 积 ,这 8 个 模板 
代表 8 个 方向 ,并 取 最 大 值 作 为 图 像 的 边缘 输出 。 实 验 表 
明 ,该 算 子 在 保持 细节 和 抗 噪声 方面 都 有 较 好 的 效果 , 比 
较 适 合 于 检测 灰 度 渐变 和 噪声 较 多 的 图 像 。 


11.5.2 二 阶 微分 算 子 图 11-17 ”Kirsch 算 子 边缘 检测 结果 


二 阶 微分 算 子 主要 包括 Laplace 边缘 检测 算 子 和 Marr 边缘 检测 算 子 。 
1. Laplace 算 子 
拉 普 拉 斯 (Laplace) 边 缘 检 测算 子 是 二 阶 导数 算 子 ,与 一 阶 差 分 算 子 相 比 ,Laplace 算 子 
能 使 噪声 成 分 得 到 加 强 , 对 噪声 更 敏感 。 该 算 子 是 一 种 各 向 同性 算 子 ,在 只 关心 边缘 的 位 置 
而 不 考虑 其 周围 的 像素 灰 度 差 值 时 比较 合适 。 其 算 子 的 形式 为 
A: (zyy) = F(z 十 1,y) 十 FGz 一 1,y) 十 1Czy 十 1) 十 FGzy 一 1) 一 4FCzyy) 
A: zyy) = jz 一 1,y 一 1) 十 zy 一 1) 十 Fz 十 1,y 一 LD) 十 zxz 一 1,y) 十 
jz 十 1 十 7z 一 1 十 1 十 1zyy 十 1 十 jz 十 1 十 1 一 87z 办 
(11-16) 
拉 普 拉 斯 边缘 检测 算 子 的 模板 如 图 11-18 所 示 ,模板 的 基本 特征 是 中 心 位 置 的 系数 为 
,其 余 位 置 的 系数 为 负 , 且 模板 的 系数 之 和 为 零 , 通 过 与 上 述 三 个 算 子 的 比较 ,可 以 看 出 该 


本 子 不 能 检测 出 边缘 的 方向 性 信息 ,因此 , 它 很 少 直接 用 于 边缘 检测 。 
0 -1 0 =i i 到 
-I 4 | =-1 8 -1 
0 =1 0 -1 A 4 
(a) (b) 


图 11-18 ” Laplace 算 子 模板 


例 11-7: Laplace 边缘 检测 算 子 示例 

采用 lena 图 像 进行 Laplace 算 子 实验 ,如 图 11-19 所 
示 是 Laplace 算 子 对 图 11-11(a) 进 行 边缘 检测 的 结果 。 

实验 结果 表明 ,Laplace 算 子 对 阶 路 边缘 定位 较 准 
确 , 该 算 子 对 孤立 像素 的 响应 比 对 边缘 或 线 的 响应 更 
强烈 ,由 于 二 阶 微分 对 噪声 的 放大 作用 ,对 噪声 很 敏 
感 ,可 能 丢失 边缘 .产生 边缘 不 连续 。 对 于 存在 一 定 强 
度 噪声 的 图 像 , 使 用 Laplace 算 子 检测 边缘 之 前 ,需要 
ee 先进 行 低 通 滤波 。 所 以 ,通常 需 将 该 算 子 和 平滑 算 子 
图 11-19 Laplace 算 子 边缘 检测 结果 “结合 起 来 ,生成 一 个 新 的 模板 。 
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2. Marr 边缘 检测 算 子 

由 于 微分 运算 对 噪声 具有 一 定 的 放大 作用 ,因此 ， 
对 于 存在 较 大 噪声 的 图 像 ,梯度 算 子 和 拉 普 拉 斯 算 子 进行 边缘 检测 存在 较 大 的 误差 。 一 种 
改进 的 方法 是 对 噪声 较 大 的 图 像 进行 噪声 抑制 , 即 先 对 图 像 进行 平滑 ,然后 再 进行 求 微分 运 
算 ,或 者 先 对 图 像 进行 局 部 线性 拟 合 ,然后 以 光滑 函数 的 导数 代替 直接 的 数值 导数 。 

1) 基本 原理 

虽然 边缘 检测 的 基本 思想 很 简单 ,但 在 实际 实现 时 却 存在 很 大 困难 ,其 根本 原因 是 , 实 
际 图 像 信 号 都 存在 有 一 定 的 噪声 。 以 一 维 信号 为 例 , 如 图 11-20(a) 所 示 为 一 种 理想 信号 , 若 
存在 噪声 , 则 实际 信号 如 图 11-20(b) 所 示 。 若 采用 前 述 方法 , 即 一 阶 导数 局 部 最 大 值 或 二 
阶 导数 过 零点 的 方法 检测 边缘 点 ,由 于 噪声 一 般 是 高 频 信 号 ,在 噪声 的 前 沿 或 后 沿 ,噪声 信 
号 的 导数 一 般 要 高 于 边缘 点 处 信号 的 导数 , 则 检测 出 来 的 可 能 是 噪声 引起 的 假 边 缘 点 。 解 
决 这 一 问题 的 办 法 是 先 对 信号 进行 平滑 滤波 ,以 滤 去 噪声 。 


一 性 


(a) 理想 边缘 信号 (b) 有 噪声 边缘 信号 
图 11-20 实际 边缘 信号 分 析 


设 平滑 滤波 器 的 冲 激 响 应 函数 以 h(x) 表示 , 先 对 信号 滤波 ,滤波 后 的 信号 为 
g(Cz) = f(z) *h(r) (11-17) 
然后 再 对 g(x) 进 行 求 一 阶 或 二 阶 导数 运算 以 检测 边缘 点 。 因 此 有 


g'(z) = C22 e 2 f(Dh(z— Dd 


=|/COW (Dd = f(z) #h (z) (11-18) 
式 中 ,h(x) 称 为 一 阶 微分 滤波 器 。 
上 式 表明 ,可 以 将 先 平滑 后 微分 的 两 个 步骤 进行 合并 。 因 此 ,边缘 检测 的 基本 方法 就 是 
设计 平滑 滤波 器 h(z) ,检测 fCz)*A(Cz) 的 局 部 最 大 值 或 二 阶 导数 的 过 零点 。 
一 般 要 求 平 滑 滤波 器 ACz) 应 满足 以 下 条 件 ; 
(1) 当 |z| 一 2,h(z) 一 0,h(z) 为 偶 函 数 。 


(2) 「 h(x)dz 二 1, 以 保证 信号 经 平滑 滤波 器 h(z) 滤 波 后 ,其 均值 不 变 。 


(3) h(z) 一 阶 及 两 阶 可 微 。 
常用 的 平滑 滤波 器 为 高 斯 (Gauss) 函数, 即 


h(z) = 


法 
em (11-19) 


no 
式 中 ,o 为 高 斯 函数 的 方差 , 称 为 高 斯 分 布 的 空间 尺度 因子 。 若 o 小 , 则 表明 函数 “ 集 
中 ”, 即 仅 在 一 个 很 小 的 局 部 范围 内 平滑 ; 随 着 o 的 增 大 ,平滑 的 范围 也 相应 增 大 ; 但 o 太 
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大 ,虽然 噪声 被 平滑 了 ,但 边缘 点 处 同样 也 是 信号 变换 较 大 的 区 域 ,于 是 边缘 点 可 能 也 被 平 
滑 掉 了 ,这 一 点 是 边缘 检测 时 应 引起 注意 的 问题 。 
对 上 式 求 导 可 得 出 高 斯 函数 的 一 阶 和 二 阶 导数 为 


过 -三 


em (11-20) 


h'(z) 一 一 


2 工 
icz) = [至 一 1] LL (11-21) 


2) Marr 边缘 检测 算法 

Marr 边缘 检测 算 子 是 一 种 用 得 较 多 的 先 平滑 然后 求 导数 的 方法 , 先 对 图 像 做 高 斯 滤 
波 , 然 后 再 求 其 拉 普 拉 斯 二 阶 导数 ,通过 检测 滤波 结果 的 零 交 叉 (zero crossings) 可 以 获得 图 
像 或 物体 的 边缘 。 对 于 二 维 图 像 信 号 , 先 用 下 述 高 斯 函数 进行 平滑 : 
Bae 2 

GCz,y'ao) 是 一 个 圆 对 称 函 数 ,其 平滑 的 作用 可 通过 o 进行 控制 。 由 于 对 图 像 进行 线性 
平滑 ,在 数学 上 是 卷 积 运算 , 设 /(z,y) 为 平滑 前 的 图 像 ,g (x,y) 为 平滑 后 的 图 像 , 因 此 可 得 

g(T1Y) = Gry0) * f (x,y) (11-233 

由 于 边缘 点 是 图 像 中 灰 度 值 变 化 剧烈 的 地 方 ,这 种 图 像 灰 度 的 突变 将 在 一 阶 导 数 中 出 
现 一 个 峰 , 或 等 价 于 二 阶 导 数 中 产生 一 个 零 交 叉 点 。 由 于 沿 梯度 方向 的 二 阶 导 数 是 非 线 性 
的 ,计算 较为 复杂 。 于 是 Marr 提出 用 如 下 拉 普 拉 斯 算 子 来 蔡 代 ( 即 以 上 式 的 零 交叉 点 作为 
边缘 点 ): 


CCZyyya) 一 (11-22) 


Vg(z,y) 一 只 (G(zyyyolxzy)) 一 (GOzyyyo))x f(r,y) (11-24) 
其 中 ,上 式 中 的 吧 G 称 为 LoG(Laplace of Gaussian) 算 子 , 即 高 斯 一 拉 普 拉 斯 (LoG) 算 

子 ,或 高 斯 一 拉 普 拉 斯 滤波 器 。 进 一 步 可 得 
品 - 部 -直人 
LoG 算 子 是 由 Marr 提出 的 边缘 检测 算 子 ,因此 有 时 又 被 称 为 Marr 算 子 。 如 图 11-21 

所 示 是 常用 的 5X5 的 LoG 算 子 模板 。 

模板 中 各 像素 到 中 心 点 的 距离 与 位 置 加 权 系 数 的 关系 可 用 图 11-22 所 示 曲 线 表示 。 若 
将 图 11-22 绕 y 轴 作 旋转 一 周 后 ,LoG 算 子 很 像 一 顶 墨 西 哥 草 帽 , 因 此 称 为 墨西哥 草帽 滤 


VGCzyy,a) 


(11-25) 


波 器 。 
2 -4 4 1 过 
-4 0 8 0 -4 
4 8 24 8 4 
-4 0 8 0 -4 
没 4 4 4 过 x 
图 11-21 5X5 的 LoG 算 子 模板 图 11-22 LoG 算 子 模板 中 心 点 的 距离 与 


位 置 加 权 系 数 关系 曲线 


LoG 算 子 将 高 斯 平滑 滤波 器 和 拉 普 拉 斯 锐 化 滤波 器 结合 起 来 , 先 平滑 除去 噪声 ,然后 
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再 进行 边缘 检测 ,因此 可 以 获得 更 好 的 效果 。 

例 11-8: LoG 边缘 检测 算 子 示例 

如 图 11-23 所 示 是 用 5X5 的 LoG 算 子 对 图 11-11(a) 
所 示 lena 图 像 进行 边缘 检测 的 结果 。 

LoG 算 子 在 (z,y) 空 间 具 有 以 原点 为 中 心 旋转 的 
对 称 性 ,LoG 滤波 器 具有 如 下 两 个 显著 的 特点 : 
(1) 该 滤波 器 中 的 高 斯 函数 部 分 对 图 像 具 有 平滑 
,可 有 效 地 消除 尺度 远 小 于 高 斯 分 布 因子 o 的 噪声 
(2) 高 斯 函数 在 空域 和 频 域内 都 具有 平滑 作用 。 型 
(3) 该 滤波 器 采用 拉 普 拉 斯 算 子 可 以 减少 计算 量 。 ”图 11.23 LoG 算 子 边缘 检测 结果 


11.5.3 ”Canny 边缘 检测 


Canny 边缘 检测 算 子 是 John F. Canny 于 1986 年 提出 的 一 个 多 级 边缘 检测 算法 。 虽 
然 Canny 算法 年 代 和 久远 ,但 可 以 说 它 是 边缘 检测 的 一 种 标准 算法 ,而且 在 图 像 研究 中 广泛 
使 用 。 该 算 子 边缘 检测 性 能 优越 ,适应 性 较 广 ,至 2017 年 12 月 ,Canny 发 表 的 该 篇 论文 已 
被 引用 22 000 余 次 。 

1. 基本 原理 

Canny 创立 了 边缘 检测 计算 理论 ,提出 了 如 下 最 优 边缘 准则 

(1) 最 优 检测 。 边 缘 算 法 能 够 尽 可 能 多 地 标识 出 图 像 中 的 实际 边缘 , 漏 检 真 实 边缘 的 
概率 和 误 检 非 边缘 的 概率 都 尽 可 能 小 。 

(2) 最 优 定位 准则 。 检 测 到 的 边缘 点 的 位 置 距离 实际 边缘 点 的 位 置 最 近 ,或 者 是 由 于 
噪声 影响 引起 检测 出 的 边缘 偏离 物体 的 真实 边缘 的 程度 最 小 。 

(3) 检测 点 与 边缘 点 一 一 对 应 。 算 子 检测 的 边缘 点 与 实际 边缘 点 应 该 一 一 对 应 。 

为 了 满足 这 些 要 求 Canny 使 用 了 变 分 法 ,这 是 一 种 寻找 优化 特定 功能 函数 的 方法 。 最 
优 检测 使 用 4 个 指数 函数 项 表示 ,但 是 它 非常 近似 于 高 斯 函数 的 一 阶 导 数 。 

2. 边缘 检测 步骤 

Canny 边缘 检测 算法 可 以 分 为 如 下 5 个 步骤 。 

1) 图 像 平 滑 ( 去 噪声 ) 

边缘 检测 算法 通常 需要 首先 对 原始 图 像 进 行 铝 稍 ,因此 .该 算法 需要 将 原始 数据 与 高 斯 
模板 进行 卷 积 运 算 ,消除 图 像 噪 声 。 这 时 ,得 到 的 图 像 与 原始 图 像 相 比 有 些 轻微 的 模糊 。 

2) 计算 梯度 幅 值 和 方向 

Canny 算法 的 基本 思想 是 找寻 一 幅 图 像 中 灰 度 强度 变化 最 强 的 位 置 , 即 指 梯度 方向 ,可 
以 采用 Sobel 算 子 进行 计算 。 


G= VGz 十 Gy ， 0 一 arctan( 全 
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梯度 角度 0 范围 从 弧度 一 x 到 ,然后 把 它 近 似 到 4 个 方向 ,分 别 代表 水 平 、 垂 直 和 两 个 对 
角 线 方向 (0,45",90°,135”)。 可 以 以 土 ix/8(i 二 1,3,5,7) 分 割 , 落 在 每 个 区 域 的 梯度 角 给 一 个 


特定 值 ,代表 4 个 方向 之 一 。Sobel 算 子 得 出 来 的 边界 通 常 非常 粗 ,难以 标定 边界 的 真正 位 置 。 
3) 非 极 大 抑制 
非 最 大 值 抑制 是 一 种 边缘 细 化 方法 。 这 一 步 的 目的 是 将 模糊 的 边界 变 得 清晰 (sharp)。 


通俗 地 讲 ,就 是 保留 了 每 ee i ee 人 Canny 准则 3 要 
求 ,边缘 只 有 一 个 精确 的 点 非 最 大 值 抑制 能 帮助 保留 局 部 最 大 梯度 而 抑制 所 有 其 他 
梯度 值 。 这 意味 着 只 保留 了 和 变化 中 最 锐利 的 位 置 
对 于 每 个 像素 点 ,进行 如 下 操作 : 
(1) 将 其 梯度 方向 近似 为 以 下 值 中 的 一 个 (0",45",90",135",180",225",270",315?)( 即 
上 下 左右 和 45" 方 向 ) 。 
(2) 比较 该 像素 点 ,和 其 梯度 方向 正 负 方向 的 像素 点 的 梯度 强度 。 
(3) 如 果 该 像 度 强 度 最 大 则 保留 ,否则 删除 , 即 置 为 0。 
1) 双 阅 值 
经 过 非 极 大 抑制 后 ,图 像 中 仍然 有 很 多 噪声 点 。Canny 算法 中 应 用 了 一 种 叫 双 阅 值 的 
方法 ， 即 设 定 一 个 阔 值 上 界 和 赣 值 下 界 (在 opencv 通常 自己 指定 ) ,图 像 中 的 像素 点 如 果 大 
本 值 上 界 , 称 为 强 边 界 (strong edge), 则 认为 必然 是 边界 ; 小 于 阅 值 下 界 , 则 认为 必然 不 
是 边界 ,两 者 之 间 的 称 为 弱 边界 (weak edge) ,认为 是 候选 项 , 需 进 行进 一 步 处 理 。 
5) 滞后 边界 跟踪 
强 边缘 点 可 以 认为 是 真 的 边缘 。 弱 边缘 点 则 可 能 是 真 的 边缘 ,也 可 能 是 噪声 或 颜色 变化 
引起 的 。 为 得 到 精确 的 边缘 ,后 者 引起 的 弱 边 缘 点 应 该 去 掉 。 通 常 认 为 真实 ; 乏 引 起 的 虹 边 
缘 点 和 强 边 的 ,而 由 噪声 引起 的 弱 边 缘 点 则 不 会 所 ees 本 边 本 院 
个 弱 边缘 点 的 8 连通 领域 像素 ,只 要 有 强 边缘 点 
保留 下 来 , 即 Canny 算法 中 ,与 强 边界 相连 的 弱 边界 认 为 是 边 界 ， - 他 角 的 弱 ; 引 边 界 则 被 抑制 。 
例 11-9: Canny 边缘 检测 示例 
如 图 11-24(a)、(b) 是 Canny 算 子 对 彩色 lena 图 像 进行 边缘 测 的 结果 ,图 11-24(c)、 
(d) 是 Sobel 算 子 的 边缘 检测 结果 。Canny 算 子 相关 参数 : 高 斯 半径 2, 高 辣 值 为 100, 低 阅 
值 为 50; Sobel 算 子 阅 值 为 100。 


(b) Canny 算 子 梯度 二 


图 11-24 Canny 算 子 边缘 检测 结果 


路 
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卫 
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(c) Sobel 算 子 梯度 幅 值 (d) Sobel 算 子 梯度 二 值 图 


图 11-24( 续 ) 


寺 果 表明 ,Canny 边缘 检测 的 效果 是 非常 理想 的 , 相 比 其 他 梯度 算 子 ,该 算 子 较 
好 地 抑制 了 噪声 引起 的 伪 边 缘 , 可 以 检测 出 真正 的 弱 边 缘 , 而 且 是 经 过 细 化 的 单 边缘 ,易于 
后 续 处 理 。Canny 算 子 对 于 对 比 度 较 低 的 图 像 ,通过 合理 选择 参数 ,也 能 有 很 好 的 边缘 检测 
效果 。 

需要 指出 的 是 ,图 像 边 缘 检 测算 法 较 多 ,各 种 算 子 各 有 优 缺 点 ,有 具体 应 用 中 应 根据 算 子 
的 检测 原理 和 研究 的 需要 对 算 子 进行 合理 的 选择 


11.6 轮廓 提取 


数字 图 像 轮廓 提取 的 目的 都 是 获得 图 像 的 外 部 轮廓 特征 ,实现 图 像 的 轮廓 跟踪 与 最 终 
轮廓 的 获取 ,为 进一步 的 图 像 分 析 做 准备 


11.6.1 轮廓 跟踪 


顾名思义 ,轮廓 跟踪 就 是 通过 顺序 逐 点 找 出 边缘 来 跟踪 目标 边界 。 在 识别 图 像 中 的 目 
标 时 ,往往 需要 对 目标 物体 的 边缘 进行 跟踪 处 理 , 即 进行 轮廓 跟踪 直到 最 后 获得 目标 轮廓 。 
若 图 像 是 二 值 图 像 或 图 像 中 不 同 的 区 域 具有 不 同 的 像素 值 ,但 每 个 区 域内 的 像素 值 是 相同 
的 ,并 具有 4 连通 或 8 连通 属性 , 则 可 以 采用 如 下 算法 实现 轮廓 跟踪 。 

1. 寻找 第 一 个 边界 点 

首先 按 从 上 到 下 、 从 左 到 右 的 顺序 扫描 图 像 ,寻找 没有 标记 跟踪 结束 记号 的 第 一 个 边界 
起 始点 Eu,E。 是 具有 最 小 行 和 列 值 的 边界 点 。 并 定义 一 个 扫描 方向 变量 dir 用 于 记录 上 一 
步 中 沿 着 前 一 个 边界 点 到 当前 边界 点 的 移动 方向 ,dir 初始 值 如 下 : 

(1) 对 4 连通 区 域 取 dir 二 3, 如 图 11-25(a) 所 示 ， 

(2) 对 8 连通 区 域 取 dir 二 7, 如 图 11-25(b) 所 示 。 

2. 计算 搜索 方向 

按 逆 时 针 方 向 搜索 当前 像素 的 3X3 邻 域 ,其 起 始 搜索 方向 按 如 下 方式 设 定 ， 

(1) 对 4 连通 区 域 取 (dir 十 3)mod 4. 如 图 11-26(a) 所 示 。 
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(a) (b) 
图 11-25 方向 变量 的 初始 化 


(2) 对 8 连通 区 域 , 若 dir 为 奇数 , 取 (dir 十 7)mod 8, 如 图 11-26(b) 所 示 ; 若 dir 为 偶 
数 , 取 (dir 十 6)mod 8, 如 图 11-26(c) 所 示 。 


(a) (b) (9) 
图 11-26 3X3 邻 域 起 始 搜索 方向 


在 3X3 邻 域 中 ,将 搜索 到 的 第 一 个 与 当前 像素 值 相 同 的 像素 作为 新 的 边界 点 Eo ,同时 
更 新 变量 方向 dir 为 新 的 值 。 

3. 找 出 所 有 边界 点 

如 果 已 , 等 于 第 二 个 边界 点 已; , 且 前 一 个 边界 点 E,-1 等 于 第 一 个 边界 点 Eo , 则 停止 搜 
索 , 结 束 跟 踪 ,否则 重复 步骤 2 继续 搜索 。 

4. 轮廓 获取 

由 边界 点 Eu 、Ei、E;、…、E,-1 构 成 的 边界 就 是 所 搜索 的 目标 边界 。 

上 述 算法 是 图 像 轮廓 跟踪 的 基本 算法 ,如 图 11-27(a) 是 原始 图 像 , 图 11-27(b) 是 应 用 
上 述 算法 进行 轮廓 跟踪 的 计算 结果 。 根 据 图 11-27(b) 可 知 ,该 算法 只 能 跟踪 目标 图 像 的 内 
边界 , 即 边 界 包含 在 目标 之 内 ,而 不 能 处 理 图 像 内 的 孔 和 洞 。 


| | 


(a) 原始 图 像 (b) 轮廓 跟踪 的 结果 
图 11-27 ”轮廓 跟踪 示例 


11.6.2 二 值 图 像 轮 请 


相对 而 言 , 二 值 图 像 轮廓 提取 的 算法 非常 简单 .就 是 采用 逐 点 掏 空 目标 物体 的 内 部 点 的 
方法 获取 二 值 图 像 轮廓 。 如 果 原 始 图 像 中 有 一 点 为 黑 , 且 它 的 8 个 邻 点 的 像素 点 都 为 黑 时 ， 
说 明 该 点 是 内 部 点 ,将 该 点 删除 , 即 置 该 像素 点 的 灰 度 值 为 255。 对 图 像 中 所 有 像素 点 执行 
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同样 的 操作 便 可 完成 图 像 轮廓 的 提取 。 
11.7 图 像 匹 配 


图 像 匹配 是 指 将 不 同时 间 、 不 同 成 像 条 件 下 对 同一 物体 或 场景 获取 的 两 幅 或 多 幅 图 像 
在 空间 上 对 准 , 或 根据 已 知 模 式 到 男 一 幅 图 像 中 寻找 相应 的 模式 。 早 期 的 图 像 匹配 技术 主 
要 用 于 几何 校正 后 的 多 波段 遥感 图 像 的 匹配 ,借助 于 对 互相 关 函 数 求 极 值 来 实现 。 

图 像 匹 配 可 以 应 用 在 机 器 识别 过 程 中 , 常 需 将 不 同 传感器 或 同一 传感器 在 不 同时 
间 、 不 同 成 像 条 件 下 对 同一 景物 获取 的 两 幅 或 多 幅 图 像 在 空间 上 对 准 ; 在 遥感 图 像 处 理 
中 需 将 不 同 波段 传感器 对 同一 景物 拍摄 的 多 光谱 图 像 按 像 点 对 应 套 准 ,然后 根据 像 点 的 
性 质 进行 地 物 分 类 。 如 果 利 用 在 不 同时 间 对 同一 地 面 拍摄 的 两 幅 照片 ,经 套 准 后 找 出 其 
中 特征 产生 了 变化 的 像 点 , 便 可 分 析 图 中 哪些 部 分 发 生 了 变化 。 此 外 ,图 像 匹 配 技术 在 
对 序列 图 像 匹 配 、 三 维 动态 景物 描述 ,物体 的 空间 结构 和 和 运动 参量 计算 等 方面 都 发 挥 了 
重要 的 作用 。 

图 像 匹配 包括 模板 匹配 、 直 方 图 匹配 、 形 状 匹配 等 多 种 匹配 方法 ,图 像 匹配 技术 已 经 在 
许多 方面 得 到 了 广泛 的 应 用 。 但 对 于 三 维 空间 ,由 于 三 维 成 像 中 有 透视 失真 ,运动 遮挡 、 阴 
影 和 噪声 干扰 等 不 利 因素 ,三 维 图 像 匹配 依然 是 一 个 值得 深入 研究 的 课题 。 


11.7.1 模板 匹配 


模板 匹配 是 指 用 一 个 较 小 的 图 像 ( 即 目标 物 形 二 
状 模板 ) 与 原始 图 像 进 行 比较 ,以 确定 在 原始 图 像 。， 下 
中 是 否 存在 与 该 模板 相同 或 相似 的 区 域 .模板 匹 ,| | | / 


配 通常 可 以 检测 出 图 像 中 的 直线 .曲线 和 边缘 图 像 th Es 
等 , 自 20 世纪 70 年 代 以 来 ,模板 匹配 也 得 到 了 广 


泛 的 应 用 。 例 如 ,目标 模板 与 侦查 图 像 的 匹配 、 目 k 

标 模板 与 制导 系统 获得 的 图 像 进行 匹配 等 。 
模板 匹配 常用 的 一 种 测度 方法 为 模板 与 原始 2 

图 像 对 应 区 域 的 误差 平方 和 。 如 图 11-28 所 示 为 图 11-28 模板 匹配 示意 图 

模板 匹配 的 原理 示意 图 。 图 中 , 设 /(x,y) 表 示 

MXNN 原 图 像 ,i(j,k) 表 示 PXQ(P<M,Q<N) 的 模板 图 像 ,两 者 原点 都 在 左上 角 。 
定义 模板 匹配 的 误差 平方 和 的 测度 为 


| 


DGzy) = > >) [F(z 十 )y 十 个 一 5 了 (11-26) 
将 上 式 展开 可 得 
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DCz,y) = > >) frtijisy th — 2 > ftjisyt RR) 十 


j=0 k=0 i=0 k=0 
1 


1= 


必 


292 看 中 数字 图 像 处 理 及 应 用 一 使 用 MATLAB 分 析 与 实现 


P= Q-i 
DSCz,y) = 2) 2) [FGz 十 1,y 十 名 了 (11-27) 
ft 
了 -ti Q=1 
DST(z,y) =2 f(z+jisyt hj,k) (11-28) 
rf 
PE-i Ci 
DTKzsy) = >) > LG RY (11-29) 
pr 


DS(z,y) 可 定义 为 原 图 像 中 与 模板 对 应 区 域 的 能 量 , 它 与 像素 位 置 (zx,y) 有 关 , 但 随 像 
素 位 置 (xz,y) 的 变化 ,DS(zx,y) 变 化 缓慢 。DST(z,y) 可 定义 为 模板 与 原 图 像 对 应 区 域 的 互 
相关 性 , 它 随 像素 位 置 (x,y) 的 变化 而 变化 , 当 模 板 r(j,k) 和 原 图 像 中 对 应 区 域 相 匹 配 时 取 
得 最 大 值 。 

DT(z,y) 称 为 模板 的 能 量 ,根据 表达 式 以 及 图 11-28, 该 项 与 图 像 像 素 位 置 (x,y) 无 关 ， 
因此 只 需 计算 一 次 即 可 。 

由 于 可 定义 DT(z,y) 与 图 像 像 素 位 置 (z,y) 无 关 , 若 DS(z,y) 近 似 为 常数 , 则 用 DST 
(zyy) 便 可 进行 图 像 匹配 。 以 图 11-28 为 例 ,根据 代数 极 值 理论 , 当 模 板 与 图 像 匹 配 时 ， 
DST(z,y) 取 最 大 值 。 但 假设 DS(z,y) 为 常数 有 时 会 产生 误差 ,严重 时 将 无 法 正确 完成 匹 
配 ,因此 可 以 对 上 述 测度 进行 适当 改进 ,采用 归 一 化 互相 关 RCz,y) 作 为 匹配 误差 平方 和 的 


测度 ,其 形式 为 
号 号 
J(z 十 Ji 十 RD)LC7J RD) 
RCz,y) - j=0 t=0 (11-30) 
FT CI FT 二 
2 >) [F(z 十 jy 十 提 了 Dp 
0 ft 


对 任何 一 幅 图 像 中 的 像素 点 (z,y) ,根据 式 (11-30) 都 可 以 得 出 一 个 相应 的 R(z,y) 值 。 
当 过 和 >y 变化 时 ,i(j,k) 在 原 图 像 区 域 中 移动 ,从 而 可 得 出 所 有 R(x,y) 值 。R(z,y) 的 最 大 
值 即 指出 了 与 j,k) 匹配 的 最 佳 位 置 ,车 从 该 位 置 开始 在 原 图 像 中 取出 与 模板 大 小 相同 的 
子 区 域 , 就 可 以 得 到 匹配 图 像 , 如 图 11-29 所 示 。 


图 11-29 模板 匹配 结果 


在 应 用 模板 匹配 法 进行 图 像 匹配 时 ,应 注意 以 下 3 点 : 
(1) 归 一 化 互相 关 法 进行 匹配 ,模板 应 在 (M 一 P 十 1) X(N 一 Q 十 1) 个 参考 位 置 上 进行 
相关 计算 ,计算 量 非常 大 ,必要 时 可 以 采用 序 贯 相似 性 检测 算法 、 幅 度 排序 相关 算法 、FFT 


到 
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相关 算法 、 分 层 搜索 序 贯 判决 等 方法 对 其 进行 改进 ,以 提高 运算 速度 。 

(2) 模板 匹配 具有 自身 的 局 限 性 ,主要 表现 在 它 只 能 进行 平行 移动 ,如 原 图 像 中 的 匹配 
目标 发 生 旋 转 或 大 小 变化 ,该 算法 无 效 。 

(3) 若 原 图 像 中 要 匹配 的 目标 只 有 部 分 可 见 ,该 算法 也 无 法 完成 匹配 。 


11.7.2 直方 图 匹配 


直方 图 匹配 就 是 指 利 用 图 像 的 直方 图 及 其 特征 量 进 行 图 像 匹配 。 由 于 颜色 是 表示 图 像 
内 容 的 一 个 重要 方法 ,因此 ,作为 图 像 检索 中 的 一 些 算法 就 采用 了 基于 颜色 特征 的 搜索 法 ， 
而 且 , 目 前 已 有 多 种 借助 颜色 特征 对 图 像 进 行 检 索 的 方法 。 现 介绍 几 种 典型 的 利用 RG、B 
颜色 空间 进行 匹配 的 方法 。 

1. 直方 图 相交 法 

设 Ha(k) 和 Hop(k) 分 别 为 查询 图 像 Q 和 数据 库 图 像 D 的 统计 直方 图 , 则 两 图 像 之 间 
的 匹配 度 Rap (Q,D) 定 义 为 


1 一 1 
>)min[Ha(k) ,Ho(k)] 
Ro (Q,D) = 4 — (Gl Ei) 
py A :0) 


k=0 


2. 欧 几 里 得 距离 法 
显然 ,采用 式 (11-31) 进 行 计算 时 ,工作 量 非常 大 ,为 减少 计算 量 , 可 采用 直方 图 的 均值 
来 简略 地 表达 颜色 信息 ,对 图 像 的 RG、B 三 个 分 量 匹配 ,此 时 查询 图 像 Q 和 数据 库 图 像 DD 


之 间 的 匹配 度 为 
Ro (Q,D) = Vfa fo) [YY (ya— pp) (11-32) 
R.G,B 


式 中 ,f 二 [yr ype wpaj pr ope vps 分 别 表 示 R、G、B 直方 图 0 阶 矩 。 

3. 参考 颜色 法 

由 于 直方 图 相交 法 计算 量 太 大 , 欧 几 里 得 距离 法 太 简略 ,因此 ,一 种 可 以 采取 的 折 中 办 
法 是 将 图 像 颜色 用 一 组 参考 色 表 示 ,这 组 参考 色 应 能 覆盖 视觉 上 可 感受 到 的 各 种 颜色 ,但 参 
考 色 的 数量 要 比 原 图 像 少 , 这 样 可 计算 简化 的 直方 图 。 

这 种 情况 下 , 若 以 x; 表示 第 i 种 颜色 出 现 的 频率 ,NN 表示 参考 颜色 表 的 尺寸 , 则 查询 图 
像 Q 和 数据 库 图 像 D 之 间 的 匹配 度 定义 为 


N 
Ro (Q,D) = | > Wi (ma 一 ro) (11-33) 
i=1 


和 -位 ra 二 0 且 ro 二 0 


式 中 


| raorip 一 0 
4. 中 心 矩 法 
灰 度 直方 图 的 灰 度 均值 即 为 其 0 阶 矩 。 实 际 上 ,图 像 的 高 阶 矩 也 可 以 应 用 , 若 以 Ma 、 
Mas Mas 分 别 表示 查询 图 像 Q 的 RG、B 分 量 直 方 图 的 ;Ci 委 3) 阶 中 心 矩 ; 以 Mbr 、Mic 、 
Mpg 分 别 表示 数据 库 图 像 D 的 RG、B 分 量 直 方 图 的 ii 委 3) 阶 中 心 矩 , 则 它们 之 间 的 匹配 
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3 3 3 
Row(Q;D) = :> Mig — Mbr)? + We >) (Ma — Mbe)’ + Wa >) (Ma — Mobs )? 
i=1 i=1 1 


(11-34) 

式 中 ,WR 、We 、Ws 为 加 权 系数 。 

以 上 4 种 方法 中 ,后 3 种 主要 是 从 减少 计算 量 的 角度 对 直方 图 相交 法 进行 适当 简化 以 
减少 运算 量 。 直 方 图 相交 法 的 另 一 个 问题 是 , 当 图 像 中 的 特征 并 不 能 取 遍 所 有 取 值 时 ,统计 
直方 图 中 可 能 会 出 现 一 些 零 值 , 由 于 零 值 的 出 现 将 给 直方 图 的 相交 带 来 影响 ,因此 ,有 可 能 
导致 利用 直方 图 相交 法 求 出 的 匹配 度 不 能 正确 反映 匹配 图 像 间 的 颜色 差别 。 

值得 注意 的 是 ,由 于 直方 图 不 能 反映 颜色 的 位 置信 息 , 因 此 有 可 能 出 现 两 幅 图 像 内 容 完 
全 不 同 , 但 直方 图 相似 。 所 以 , 仅 用 简单 的 颜色 直方 图 匹配 可 能 造成 识别 错误 。 因 此 ,有 必 
要 对 直方 图 匹配 进行 适当 改进 ,改进 的 基本 思路 是 利用 匹配 过 程 中 的 位 置信 息 。 例 如 ， 
A. Nagasaka 和 Y. Tanaka 提出 的 方法 是 将 图 像 划分 为 若干 可 以 一 定 程度 上 反映 位 置信 息 
的 子 块 ,分 别 对 各 子 块 进行 匹配 ,从 而 提高 直方 图 匹配 法 的 适应 性 。 


5. X? 直方 图 匹配 
对 于 灰 度 图 像 ,X? 直方 图 匹配 度 定义 为 
L-—l 
[Heo(k) 一 Ho (AR) . 
Ro (Q.D) 之 TE (11-35) 
而 对 于 RG、B 图 像 ,X? 直方 图 匹配 度 的 计算 公式 则 为 
Ll ns 
四 [HS8(k) 一 HB(E)] , [HSC(k) — HEC(k)]: , [CHSCk) 一 HBCE)J? 
Re 包 | 万 8(CA) 万 8(A) | HBCE) } 
(11-36) 


X* 直方 图 匹配 与 模板 匹配 或 颜色 直方 图 匹配 相 比 具有 更 好 的 识别 率 , 对 于 识别 镜头 切 
换 (abrupt scene change) 具 有 良好 的 效果 。 

A，Nagasaka 和 Y. Tanaka 通过 对 灰 度 模板 匹配 、 彩 色 模 板 匹 配 、 灰 度 直方 图 匹配 、 颜 
色 直 方 图 匹配 和 X? 直方 图 匹配 多 种 方案 进行 了 比较 研究 。 结 果 表 明 , 采 用 图 像 分 块 并 结 
合 X? 直方 图 匹配 在 镜头 切换 识别 方面 具有 很 好 的 效果 ,但 对 镜头 渐变 识别 的 效果 依然 存 
在 一 定 的 问题 。 


11.7.3 形状 匹配 


形状 是 描述 图 像 内 容 的 一 个 重要 特征 ,因此 ,可 以 利用 形状 进行 匹配 。 但 采用 形状 进行 
匹配 应 综合 考虑 如 下 三 个 问题 。 

(1) 形状 常 与 目标 特征 相 联 系 ,与 颜色 特征 相 比 ,形状 特征 被 认为 是 更 高 层次 的 图 像 特 
征 。 要 获取 目标 的 有 关 形 状 参数 ,一般 应 先 对 图 像 进行 分 割 , 所 以 形状 特征 会 受 图 像 分 割 结 
果 精 度 的 影响 。 

(2) 目标 形状 的 描述 是 一 个 非常 抽象 和 复杂 的 问题 ,目前 还 没有 与 人 的 感觉 一 致 且 被 
大 多 数 人 所 接受 的 关于 图 像 形状 描述 的 确切 数学 定义 。 

(3) 从 不 同 视 角 和 方法 获取 的 图 像 中 目标 形状 可 能 会 有 很 大 差别 ,为 准确 进行 形状 匹 
配 ,应 保证 平移 尺度、 旋转 变换 的 不 变性 等 。 
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目标 轮廓 一 定 程度 上 可 以 表示 目标 物体 的 形状 。 轮 廓 是 由 物体 的 一 系列 边界 点 所 形成 
的 ,因此 根据 图 像 分 析 的 相关 理论 可 知 , 在 较 大 尺度 下 一 般 能 较 可 靠 地 消除 对 物体 边界 点 的 
误 检 , 但 却 对 边界 的 定位 易 产生 不 准确 ; 相反 ,在 较 小 尺度 下 .虽然 增加 了 边界 点 误 检 的 比 
例 , 但 对 物体 或 区 域 真 正 边界 点 的 定位 却 比 较 准 确 。 因 此 ,可 以 结合 两 者 的 优点 , 即 可 先 在 
较 大 尺度 下 检测 出 真正 的 边界 点 ,然后 在 较 小 尺度 下 对 边界 点 进行 较 精确 的 定位 。 

目前 ,常用 的 形状 匹配 法 主要 有 不 变 矩 法 .几何 参数 法 、 特 征 模 表示 法 、 边 界 方向 直方 图 
法 .小波 重 要 系数 法 以 及 我 国学 者 杨 翔 英 . 章 航 晋 于 1999 年 发 表 的 小 波 轮廓 表示 法 等 许多 
方法 。 有 着 数学 显微镜 之 称 的 小 波 变换 与 分 析 作 为 一 种 多 尺度 、 多 分 辨 率 的 分 析 工具 ,比较 
适合 于 对 图 像 进行 多 尺度 的 边界 检测 。 


11.8 边缘 检测 的 MATLAB 实现 
11.8.1 程序 代码 


function EdgeDetection(action, varargin) 
名 基于 差分 运算 的 数字 图 像 边 缘 检 测 软 件 主要 函数 说 明 
% InitializeEdgeDetection :检测 程序 相关 功能 初始 化 


% ComputeEdgeMap :计算 原始 图 像 边 缘 

% SelectMethod :选择 边缘 检测 方法 

% LoadNewImage : 读 入 被 选择 的 图 像 

% UpdatesprThreshCtrl :数据 更 新 

% UpdateLOGSize 一 :更 新 与 LOG 滤波 器 相关 的 数据 


if nargin<1, 
action = 'InitializeEdgeDetection'; 
end; 
feval(action, varargin{ :}); 
return; 
多 多 第 前 数 InitializeEdgeDetection 
function InitializeEdgeDetection() 
h = findobj(allchild(0), ‘tag', 'EdgeDetectionSoft'); 
证 一 isempty(h) 
figure(h(1)) 
return 
end 
screenD = get(0, 'ScreenDepth'); 
if screenD>8 
grayres = 256; 
else 
grayres = 128; 
end 
EdgeDetectionFig = figure( ... 
'Name', ' 基 于 差分 运算 的 数字 图 像 边缘 检测 软件 '，… 
'NumberTitle', 'off', 'HandleVisibility', ‘on', ... 
'tag'，' 基 于 差分 运算 的 数字 图 像 边缘 检测 软件 '，.… 
‘Visible', 'off', 'Resize', 'off', 
'BusyAction', 'Queue', EEL 'off 
CBE ,SG 5 
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"IntegerHandle'，'off'，... 
‘DoubleBuffer', 'on', ... 
‘Colormap', gray(grayres)); 


figpos = get(EdgeDetectionFig, 'position'); 
调节 图 像 窗口 尺寸 

figpos(3:4) = [560 420]; 

horizDecorations = 10; % resize controls, etc. 
vertDecorations = 45; %title bar, etc. 
screenSize = get(0, 'ScreenSize'); 


E 


(screenSize(3) <= 1) 
% No display connected (apparently) 
screenSize(3:4) = [100000 100000]; 


end 


if 


(((figpos(3) + horizDecorations) > screenSize(3)) | ... 
((figpos(4) + vertDecorations) > screenSize(4))) 
名 窗口 尺寸 太 小 
delete(EdgeDetectionFig); 
error([ 'Screen resolution is too low ', ... 
‘(or text fonts are too big) to run this edgesoft']); 


end 
dx = screenSize(3) - figpos(1) - figpos(3) — horizDecorations; 
dy = screenSize(4) - figpos(2) - figpos(4) — vertDecorations; 
if (dx < 0) 
figpos(1) = max(5,figpos(1) + dx); 
end 
if (dy < 0) 
figpos(2) = max(5,figpos(2) + dy); 
end 


set(EdgeDetectionFig, 'position', figpos); 
rows = figpos(4); cols = figpos(3); 


hs = (cols- 512) /3; 名 垂直 间距 
bot = rows 一 2*hs-256; 名 图 像 底部 
名 按钮 和 菜单 参数 

ifs = hs/2; 


Std. Interruptible = 'off'; 
Std. BusyAction = 'queue'; 

名 原始 图 像 轴线 

hdl. ImageAxes = axes(Std, ... 


‘Units', ‘Pixels', ... 

'Parent', EdgeDetectionFig, ... 
'ydir', ‘reverse', ... 

XLin', [.S5 256,5], ... 

Thin’ [5 256.5]75s 
"CCim'，[0 255], ... 

'Position', [hs bot 256 256], ... 
‘XTick', [], 'YTick', []); 


set(get(hdl. ImageAxes，'title')，'string'，' 原 始 图 像 '); 
边缘 图 像 轴线 
hdl. EdgeAxes = axes(Std, ... 


‘Units', 'Pixels', ... 
'Parent', EdgeDetectionFig, ... 


'ydir', 'reverse', ... 
TO [5 0605] si 
Thi .5S 25525J7 
"Chim [Ol], 6 
'Position', [cols — hs — 256 bot 256 256], ... 
‘XTick', [], 'YTick', []); 
set(get(hdl. EdgeAxes，'title')，'string'，' 边 缘 图 像 '); 


s# 原始 图 像 
hdl. Image = image(Std, ... 
"Chata', [], 6 


'CDataMapping', 'scaled', 
'Parent', hdl. ImageAxes, ... 
'xdata', [1 256],... 


'Ydata', [1 256],... 
'EraseMode', ‘none'); 
边缘 图 像 
hdl. Edge = image(Std, ... 
ICBaka [J, 


'CDataMapping', 'scaled', ... 
'Parent', hdl. EdgeAxes, ... 
Xdata', [1 256];..。 
'Ydata', [1 256],... 
'EraseMode', ‘none'); 

外 Background color for frames 

bgcolor = [0.45 0.45 0.45]; 

fgcolor = [11 1]; % For text 

名 菜单 框架 

mfleft = hs; 

mfbot = hs; 

mfwid= (3* cols/8) -1.5* hs; 

mfht = bot— 2* hs; 

hdl. MenuFrame = uicontrol(Std, ... 
'Parent', EdgeDetectionFig, ... 
'Style', 'frame', ... 
'Units', ‘pixels', . 
'Position', [mfleft mfbot mfwid mfht], ... 
'BackgroundColor', bgcolor); 

名 图 像 下 拉 菜 单 

ipwid = mfwid— 2* ifs; 

ipht = 21; 

ipleft = mfleft+ ifs; 

ipbot = mfbot+1.7* ifs + 2* ipht; 

hdl. ImgPop = uicontrol (Std, ... 
'Parent', EdgeDetectionFig, ... 
'Style', ‘popupmenu', ... 
‘Units', 'pixels', ... 
'Position', [ipleft ipbot ipwid ipht], ... 
'Enable', 'on', ... 


'String', ' 米 粒 | 土 星 | 钱币 1| 电 路 | 轮 盘 | 飞船 | 钱币 2| 玻 璃 '，.… 


'Tag', 'ImagesPop', ... 
'Callback', 'EdgeDetection( ''LoadNewImage"') '); 
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#% 图像 菜单 标签 

uicontrol( Std, ... 
'Parent', EdgeDetectionFig, ... 
'Style', 'text', ... 
'Units', 'pixels', ... 
'Position', [ipleft ipbot + ipht ipwid 18], ... 
‘Horiz'y"Lleft' si 
'Background', bgcolor, ... 
'Foreground', fgcolor, ... 
'String', ' 选 择 原 始 图 像 :'); 

% 算 子 选择 菜单 

hdl. Method = 'Sobel'; 

mpwid = ipwid; 

mpht = ipht; 

mpleft = ipleft; 

mpbot = mfbot+1.2* ifs; 

hdl. MethodPop = uicontrol(Std, ... 
'Parent', EdgeDetectionFig, ... 
'Style', 'popupmenu', ... 
'Units', 'pixels', ... 
'Position', [mpleft mpbot mpwid mpht], ... 
'Enable', 'on', ... 


'String', 'Sobel | Prewitt|Roberts|Laplacian of Gaussian|Canny', ... 


'Tag', 'MethodPop', ... 
'Callback', 'EdgeDetection( ''SelectMethod'') '); 
# 算 子 选择 菜单 标签 文本 
uicontrol( Std, ... 
'Parent', EdgeDetectionFig, ... 
'Style', 'text', ... 
Units', ‘pixela’, ,.. 
'Position', [mpleft mpbot + mpht mpwid 18], ... 
‘Horiz'y latt'y 
"Background ', bgcolor, ... 
'Foreground', fgcolor, ... 
'String', ' 选 择 边 缘 检 测算 子 :'); 
名 框架 参数 
pfleft = (3*cols/8) +0.5*hs; 
pfbot = 1.5xhs; 
pfwid = (3* cols/8) - hs; 
pfht = bot—2.5*hs; 
hdl. ParamFrame = uicontrol(Std, ... 
'Parent', EdgeDetectionFig, ... 
'Style', 'frame', ... 
‘Units', ‘pixels', ... 
"Position'，[ pfleft pfbot pfwid pfht ], ... 
'BackgroundColor', bgcolor); 
名 域 值 控制 文本 标签 
labelleft = pfleft+ ifs; 
labelwid = pfwid/2— hs; 
labelbot = pfbot+2* pfht/3; 
hdl. sprThLb] = uicontrol(Std,... 


上 
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'Parent', EdgeDetectionFig, ... 

'Style', 'text', ... 

'Units', 'pixels', ... 

'Position', [labelleft labelbot labelwid 18], ... 

‘Boeriz', Lett', ,.. 

'string', ' 域 值 :'，.… 

'BackgroundColor', bgcolor, ... 

'ForegroundColor', fgcolor); 
hdl. Threshold = 0; 
raleft = pfleft + pfwid/2 — hs/2; 
rabot = pfbot+ 2#*pfht/3 + hs/6; 
rawid = pfwid/2; 
raht = ipht; 
hdl. RadioAutomatic = uicontrol(Std, ... 

'Parent', EdgeDetectionFig, ... 

'Style', 'radiobutton', ... 

'Units', 'pixels', ... 

'Position', [raleft rabot rawid raht], ... 

'String', ' 自 动 匹配 '，.…. 

‘value',1, 'Userdata',1, ... 

'Callback', 'EdgeDetection( ''Radio'', ''auto'’) '); 
rmleft = pfleft + pfwid/2 - hs/2; 
rmbot = pfbot + pfht/3 + hs/3; 
rmwid = hs*1.5; 
rmht = ipht; 
hdl. RadioManual = uicontrol(Std, ... 

'Parent', EdgeDetectionFig, ... 

'Style', 'radiobutton', ... 


'Units', 'pixels', ... 
'Position', [rmleft rmbot rmwid rmht], ... 
"Sr dong "Vs ss 
‘value', 0, 'Userdata', 0, ... 
'Callback', 'EdgeDetection( ''Radio'', ''manual'') '); 
thleft = rmleft + rmwid; 
thwid = rawid— rmwid; 
thbot = rmbot; 
thht = rmht; 


hdl. ThreshCtrl = uicontrol(Std, ... 
'Parent', EdgeDetectionFig, ... 
‘Enable', 'off', ... 
'Style', ‘edit', ... 
'Units', 'pixels', ... 
'Position', [thleft thbot thwid thht], ... 
'Horiz', 'right', 
'Background', 'white', ... 
'Foreground', 'black', ... 
‘String’, 0.... 
'callback', 'EdgeDetection( ''UpdateSprThresh'') '); 
名 算 子 方向 选择 菜单 
dpwid = pfwid/2; 
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dpht = ipht; 
dpleft = pfleft + pfwid/2 — hs/2; 
dpbot = pfbot+ .4*x hs; 
hdl. sprDirPop = uicontrol(Std, 
'Parent', EdgeDetectionFig, ... 
'Style', 'popupmenu', ... 
Vaite'y pinelety si 
'Position', [dpleft dpbot dpwid dpht], ... 
'Enable', 'on', ... 
'String', ' 水 平 垂 直 | 水 平方 向 | 垂直 方向 '，.… 
'Tag', 'DirectionPop',... 
'Callback', 'EdgeDetection( ''UpdateDirectionality"') '); 
名 算 子 方向 选择 文本 标签 
labelleft = pfleft+ ifs; 
labelwid = pfwid/2— hs; 
labelbot = dpbot; 
hdl. sprDirLbl = uicontrol( Std, ... 
'Parent', EdgeDetectionFig, ... 
'Style', 'text', ... 
'Units', 'pixels', ... 
'Position', [labelleft labelbot labelwid 18], ... 
"oriz', "lott', 5 
'Background', bgcolor, ... 
'Foreground', fgcolor, ... 
'string', ' 算 子 方向 : "); 
hdl.Directionality = 'both'; 
hdl. logSigmaCtrl] = uicontrol(Std, ... 
'Parent', EdgeDetectionFig, ... 
'Style' 'edit', ... 
'Units', 'pixels', ... 
'Position', [dpleft dpbot dpwid dpht], ... 
"Horiz"'y right', oo 
'Background', 'white', ... 
'Foreground', 'black', ... 
'String', 2', 


'Tag', 'DirectionPop', ... 
Visible', 'off', ... 
'Callback', 'EdgeDetection( ''UpdateLOGSigma'') '); 
% Sigma 编辑 框 文本 
hdl. 1ogSigmaLbl = uicontrol( Std，.… 
'Parent', EdgeDetectionFig, ... 
‘Style', texk'; ... 
'Units', 'pixels', ... 
'Position', [labelleft labelbot labelwid 18], ... 
"Horie'’; "LaFt" ss 
'Background', bgcolor, ... 
'Foreground', fgcolor, ... 
‘Visible', ‘off', ... 
'String', 'Sigma: '); 
hdl.LogSigma = 2; 
% 状态 条 


到 
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colr = get(EdgeDetectionFig, 'Color'); 
hdl. Status = uicontrol( Std，... 
'Parent', EdgeDetectionFig, ... 
'Style', 'text', ... 
'Units', 'pixels', ... 
'Background', colr, ... 
'Foreground', [.8 0 0], ... 
'Position', [pfleft 2 pfwid 18], ... 
'Horiz', 'center', ... 
'Tag', 'Status', ... 
'String', 'Initializing EdgeDetectionSoft 


% 消息 等 有 关 按 钮 框 
bfleft = (3*xcols/4)+.5*hs; 
bfbot = hs; 


bfwid = (cols/4)—1.5*hs; 
bfht = bot—2*hs; 
hdl. ButtonFrame = uicontrol(Std, ... 
'Parent', EdgeDetectionFig, ... 
'Style', 'frame', ... 
'Units', 'pixels', ... 
'Position', [ bfleft bfbot bfwid bfht ], ... 
'BackgroundColor', bgcolor); 
运行 程序 按 钮 设计 
btnwid = bfwid — 2*x ifs; 
btnht = (bfht— 4x ifs)/3;% 21 
btnleft = bfleft + ifs; 
btnbot = bfbot + bfht — ifs — btnht; 
hdl. Apply= uicontrol(Std, ... 
'Parent', EdgeDetectionFig, ... 
'Style', ‘pushbutton', ... 
'Units', 'pixels', ... 
'Position', [btnleft btnbot btnwid btnht], ... 
'Enable', 'off', ... 
'String', "运行 程序 '，.… 
'Callback', 'EdgeDetection( ''ComputeEdgeMap'') '); 
% 消息 按钮 
btnbot = bfbot + bfht — 2*xifs — 2xbtnht; 
hdl. Help = uicontrol(Std, ... 
‘Parent', EdgeDetectionFig, ... 
'Style', 'pushbutton', ... 
‘Units', 'pixels', ... 
'Position', [btnleft btnbot btnwid btnht], ... 
'Enable', 'off', ... 
'string', "信息 '，..…. 
'Callback', ‘helpwin EdgeDetection'); 
名 退出 按钮 
btnbot = bfbot + ifs; 
hdl.Close= uicontrol(Std, ... 
'Parent', EdgeDetectionFig, ... 
'Style', 'pushbutton', ... 
'Units', 'pixels', ... 
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'Position', [btnleft btnbot btnwid btnht], ... 
'Enable', 'off', ... 
'string', ' 退 出 '，.… 
'Callback', 'close( gcbf) '); 
set(EdgeDetectionFig, 'Userdata', hdl, ‘Visible', ‘on'); 
drawnow 
LoadNewImage( EdgeDetectionFig); 
drawnow 
set(EdgeDetectionFig, 'HandleVisibility', 'Callback'); 
set([hdl. Apply hdl. Help hdl.Close] , ‘'Enable', 'on'); 
return 


多 孙 数 ComputeEdgeMap 
function ComputeEdgeMap( MyEdgeFig) 
if nargin<1 
callb = 1; 
MyEdgeFig = gcbf; 
else 
callb = 0; 名 初 始 化 
end 
set (MyEdgeFig, 'Pointer', 'watch'); 
setstatus(MyEdgeFig，' 计 算 边 缘 图 像 .…'); 
hdl = get (MyEdgeFig, 'Userdata'); 
img = getimage(hd1. Image); 
autothresh = get(hdl. RadioAutomatic, ‘Value'); 
Switch hdl. Method 
case {'Sobel', 'Roberts', 'Prewitt'} 
if autothresh 
[edgemap, thresh] = edgel(img, hdl.Method, hdl.Directionality); 
setstatus([ ' 域 值 为 : ' num2str(thresh) '. ']); 
else 
edgemap = edge(img, ... 
hdl. Method, hdl.Threshold, hdl.Directionality); 
setstatus(MyEdgeFig, ''); 
end 
case 'Laplacian of Gaussian’ 
if autothresh 
[edgemap, thresh] = edge(img, ‘lo0g', [], hdl.LogSigma); 
setstatus(MYEdgeFig，[ ' 域 值 为 : ' num2str(thresh) '. ']); 
else 
edgemap = edgel(img, 'log', hdl.Threshold, hdl.LogSigma); 
setstatus(MyEdgeFig, ''); 
end 
case 'Canny' 
if autothresh 
[edgemap, thresh] = edge(img, ‘canny', [], hdl.LogSigma); 
% statstr = sprintf('Thresholds are [ %0.4f,0.4f].', thresh(1),thresh(2)); 
setstatus(MYEdgeFig，[ ' 高 域 值 为 : ' num2str(thresh(2)) '.']); 
else 
[edgemap, thresh] = edge(img, ‘canny', hdl.Threshold, hdl.LogSigma); 
% statstr = Sprintf( 'Thresholds are [ % 0.4f,0.4f].', thresh(1), thresh(2)); 


setstatus(MyEdgeFig, ''); 
end 
otherwise 
error( 'EdgeDetection: Invalid edge detection method. '); 
end 
set(hdl. Edge, 'CData', edgemap); 
set(hdl. Apply, 'Enable', 'off'); 
set (MyEdgeFig, 'Pointer', 'arrow'); 
drawnow 
名 孙 数 SelectMethod 
function SelectMethod 
MyEdgeFig = gcbf; 
hdl = get(MyEdgeFig, 'userdata'); 
V = get(hdl.MethodPop, {'value', 'String'}); 
hdl. Method = deblank(v{2}(v{1},:)); 
Switch hdl. Method 
case {'Sobel', 'Prewitt'} 
ActivateSPRControls(MyEdgeFig); 
set(hdl. sprDirPop, 'Enable', 'on'); 
case 'Laplacian of Gaussian' 
ActivateLOGControls(MyEdgeFig); 
set(hdl. logSigmaCtrl], 'String', '2'); 
hdl.LogSigma = 2; 
case 'Canny' 
ActivateLOGControls(MyEdgeFig); 
set(hdl. logSigmaCtrl, 'String', '1'); 
hdl. LogSigma = 1; 
case 'Roberts' 
RctivateSPRControls(MYEdgeFig) ; 
set(hdl. sprDirPop, 'Enable', 'off', 'value', 1); 
otherwise 
error( 'EdgeDetection: invalid method specifier. '); 
end 
set(hdl. Apply, ‘Enable', 'on'); 
set(MyEdgeFig, ‘userdata', hdl); 
% BlankOutEdgeMap( MyEdgeFig); 


setstatus(MYEdgeFig，[ ' 单 击 “' 运 行程 序 按钮 " 计算 图 像 边缘 . 


名 函数 LoadNewImage 
function LoadNewImage(MYEdgeFig) 
if nargin<1 


callb = 1; 
MyEdgeFig = gcbf; 
else 
callb = 0; 
end 


set (MyEdgeFig, 'Pointer', 'watch'); 

hdl = get (MyEdgeFig, 'Userdata'); 

Vv = get(hdl. ImgPop, {'value', 'String'}); 
name = deblank(v{2}(v{1},:)); 

drawnow 
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Switch name 
case "飞船 '， 
liftbody256 = []; 
load imdemos liftbody256 
img = liftbody256; 
case ' 钱 币 1'， 
coins2 = []; 
load imdemos coins2 
img = coins2; 
case "米粒 '， 
rice3 = []; 
load imdemos rice3 
img = rice3; 
case ' 土 星 '， 
saturn2 = []; 
load imdemos saturn2 
img = saturn2; 
case ' 钱 币 2 
eight = []; 
load imdemos eight 
img = eight; 
case ' 电 路 '， 
circuit4 = []; 
load imdemos circuit4 
img = circuit4; 
case ' 轮 盘 '， 
vertigo2 = []; 
load imdemos vertigo2 
img = vertigo2; 
case ' 玻 璃 '， 
glass2 = []; 
load imdemos glass2 
img = glass2; 
otherwise 
error( 'EdgeDetection: Unknown Image Option! '); 
end 
set(hd1. Image, 'Cdata', img); 
set(get(hdl. ImageAxes, 'title'), 'string',[ ' 原 始 ' name ' 图 像 ']); 
set(MyEdgeFig, 'Pointer', 'arrow'); 


if callb 
set(hdl. Apply, ‘Enable', ‘on'); 
end 
drawnow 
名 应 用 Lo6 算 子 时 ,采用 自动 域 值 计算 


证 ~stremp(hdl. Method, ‘Laplacian of Gaussian') 
if get(hdl.RadioAutomatic, ‘Value') ==0 
Radio( 'auto', MyEdgeFig); 
end 
end 


ComputeEdgeMap(MyEdgeFig); 
return; 


名 孙 数 UpdateSprThresh 
function UpdateSprThresh( ) 
MyEdgeFig = gcbf; 
hdl = get(MyEdgeFig, 'UserData'); 
V = hdl.Threshold; 
s = get(hdl.ThreshCtr], 'String'); 
vv = real(evalin('base',['['s ']'],num2str(v))); 
if isempty(vv) | ~isreal(vv) | vv(1)<0 
vw =v; 
set(gcbo, 'String', num2str(vv)); 
return 
end 
v = round(vv(1) * 1000000)/1000000; 
set(gcbo, 'String', num2str (vv)); 
hdl. Threshold = vv; 
set(hdl. Apply, 'Enable', 'on'); 
setstatus(MyEdgeFig，' 单 击 “"' 运 行程 序 按钮 ' 计算 图 像 边缘 . '); 
set(MyEdgeFig, 'UserData', hdl); 
return 
$6 函数 UpdateDirectionality 
function UpdateDirectionality() 
MyEdgeFig = gcbf; 
hdl = get(MyEdgeFig, 'UserData'); 
Vv = get(hdl. sprDirPop, {'value', 'String'}); 
dir = deblank(v{2}(v{1}, :)); 
set(hdl. sprDirPop, 'userdata', dir); 
hdl.Directionality = dir; 
set(hdl. Apply, ‘Enable', 'on'); 
setstatus(MyEdgeFig，' 单 击 "' 运 行程 序 按钮 ' 计算 图 像 边 缘 . '); 
set(MyEdgeFig, 'UserData', hdl); 
return 
% 函数 Radio 
function Radio(control, MyEdgeFig) 
if nargin<2 
MyEdgeFig = gcbf; 
end 
hdl = get(MyEdgeFig, 'UserData'); 
if strcmp(control，'auto') 
set(hdl. RadioAutomatic, ‘Value', 1); 
set(hdl. RadioManual, 'Value', 0); 
set(hdl. ThreshCtrl, 'Enable', 'off'); 
set(hdl. Apply, 'Enable', 'on'); 


setstatus(MyEdgeFig，' 单 击 “"' 运 行程 序 按钮 "计算 图 像 边缘 . '); 


elseif strcmp(control, ‘manual') 
set(hdl. RadioAutomatic, ‘Value', 0); 
set(hdl. RadioManual, 'Value', 1); 
set(hdl. ThreshCtrl, 'Enable', 'on'); 
set(hdl. Apply, ‘'Enable', 'on'); 
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程序 


setstatus(MyEdgeFig，' 单 击 “"' 运 行程 序 按钮 "计算 图 像 边 缘 . '); 


end 
return 


外 函数 UpdateLOGSigma 
function UpdateLOGSigma( ) 
MyEdgeFig = gcbf; 
hdl = get(MyEdgeFig, 'UserData'); 
V = hdl.LogSigma; 
s = get(hdl. 1ogSigmaCtr1l, 'String'); 
vv = real(evalin('base',s,num2str(v))); 
if isempty(vv) | ~isreal(vv) | vv(1)<0 
vv = vi 
set(hdl. 1ogSigmaCtr1l, 'String', num2str(vv)); 
return 
end 
vv = round(vv(1) * 100)/100; 
set(hd1. logSigmaCtr], 'String', num2str(vv)); 
hdl. LogSigma = vv; 
set(hdl. Apply, 'Enable', 'on'); 
setstatus(MyEdgeFig，' 单 击 "' 运 行程 序 按钮 ' 计算 图 像 边 缘 . '); 
set(MyEdgeFig, 'UserData', hdl); 
return 


多 函数 ActivateSPRControls 

function RctivateSPRControls(MYEdgeFig) 

hdl = get(MyEdgeFig, 'UserData'); 

set([hdl. sprDirPop hdl. sprDirLbl]], 'Visible', ‘on'); 
set([hdl. logSigmaCtrl hdl. logSigmaLbl], ‘Visible', ‘off'); 
% 函数 ActivateLOGControls 

function ActivateLOGControls(MyEdgeFig) 

hdl = get(MyEdgeFig, 'UserData'); 

set([hdl. logSigmaCtr] hdl. logSigmaLbl], 'Visible', 'on'); 
set([hdl. sprDirPop hdl. sprDirLb]], Visible', 'off'); 


11.8.2 应 用 举例 


进入 MATLAB(7.0 及 以 上 版 本 ) ,选择 Debug 菜单 中 的 Run 命令 运行 EdgeDection 
,弹出 如 图 11-30 所 示 的 MATLAB Editor 对 话 框 ,选择 Add directory to the bottom of 


the MATLAB path 单 选 按钮 即 可 运行 程序 。 


程序 EdgeDection 可 进行 基于 差分 运算 的 二 维 图 像 边缘 检测 运算 ,程序 运行 界面 如 


图 11-31 所 示 。 


以 下 
等 进 
及 边 


边缘 检测 程序 EdgeDection 实现 了 常用 的 边缘 检测 算 子 并 可 选择 算 子 方向 ,各 功能 均 
拉 菜 单方 式 实现 。 应 用 该 程序 可 方便 地 对 原始 图 像 .边缘 检测 算 子 及 差分 算 子 的 方向 
行 选 择 。 例 如 , 若 原始 图 像 选择 土星 图 像 , 边 缘 检 测 方法 选择 Sobel 算 子 , 则 原始 图 像 


缘 检 测 的 结果 图 像 如 图 11-32 所 示 。 
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WATLAB Editor 


A File CADocuments and SetingsyuariMy Documents\cth\g 稳 处 理 文 煌 IEdgeDetection mis notfound In the current directory 
oronthe MATLAB palh. 


To run this file, select one ofthe following 
© change MATLAB current directory 


© Add directory to the top ofthe MATLAB path 


© Rdd directory to the botom ofthe MATLAB pa 


图 11-30 MATLAB Editor 对 话 框 


) 基于 差分 运算 的 数字 图 像 边 举 检测 软件 
Eile 了 it Yer Insert Lools Yindor Welp 


原始 米粒 图 像 


选 振 原 嫌 图 像 


和 短 边 经 检测 乱 子 


图 11-31 ”EdgeDection 程序 运行 结果 


图 11-32 土星 图 像 的 运行 结果 
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习题 


1. 什么 是 图 像 分 割 ? 常用 的 图 像 分 割 方法 可 以 分 为 哪 几 种 类 型 ? 

2. 试 简 述 灰 度 阔 值 分 割 算法 的 基本 原理 。 

3. 根据 灰 度 阔 值 分 割 法 的 基本 原理 ,设计 一 个 MATLAB 程序 找 出 具有 双 峰 直方 图 特 
性 图 像 的 最 佳 分 割 阔 值 。 

4. 若 有 一 幅 图 像 ,已 知 其 背景 和 目标 灰 度 均 服从 正 态 分 布 ,其 均值 分 别 为 上 和 v, 且 图 
像 与 背景 面积 相等 , 试 确定 其 最 佳 阔 值 。 

5. 基于 区 域 的 图 像 分 割 方 法 主要 包括 哪 几 种 算法 ? 

6. 阐述 区 域 分 裂 与 合并 法 的 实现 过 程 。 

7. 什么 是 图 像 的 边缘 ? 常见 的 边缘 信号 有 哪儿 种 类 型 ? 

8. 基于 一 阶 差分 运算 的 边缘 检测 算 子 主要 包括 哪些 ? 各 有 何 特点 ? 

9. 基于 二 阶 差 分 运算 的 边缘 检测 算 子 主要 包括 哪些 ? 各 有 何 特 点 ? 

10. 在 数字 图 像 边缘 检测 中 ,Laplace 算 子 有 何 特点 ? 

11. Canny 提出 的 最 优 边缘 准则 是 什么 ? 

12. 试 简 述 Canny 边缘 检测 算法 的 步骤 。 

13. 选择 一 幅 图 像 ,编写 MATLAB 程序 进行 Canny 边缘 检测 。 

14. LoG 算 子 的 基本 原理 是 什么 ? 它 具 有 哪些 特点 和 作用 ? 

15. 应 用 本 章 的 边缘 检测 程序 EdgeDetection 进行 3 一 6 种 图 像 的 边缘 检测 实验 ,分 析 
各 种 算 子 的 特点 和 适应 性 。 

16. 在 数字 图 像 处 理 中 ,如 何 实现 轮廓 跟踪 ? 

17. 根据 模板 匹配 法 中 匹配 误差 测度 的 定义 ,分 析 其 意义 和 作用 。 

18. 数字 图 像 处 理 技 术 中 常用 的 直方 图 匹配 主要 有 哪 几 种 方法 ? 各 有 何 特点 ? 


i 图 像 特征 与 理解 


CHAPTER 12 


图 像 分 割 将 一 幅 图 像 分 解 成 若干 个 特定 的 ,具有 独特 性 质 的 区 域 ,而 图 像 特征 与 理解 是 
指 对 分 割 以 后 的 图 像 , 提 取 图 像 内 的 物体 或 区 域 的 特征 ,以 用 于 图 像 识 别 、 分 类 和 理解 等 。 
图 像 特 征 是 区 分 一 个 图 像 内 物体 或 区 域 的 最 基本 属性 和 特点 。 图 像 特征 既 可 以 是 人 的 视觉 
能 够 识别 的 自然 特征 ,也 可 以 是 通过 对 图 像 进行 测量 和 处 理 , 人 为 获取 或 定义 的 某 些 特征 。 
这 些 特征 可 以 包括 几何 特征 和 形状 特征 等 ,如 物体 的 周 长 、 面 积 ,以 及 物体 或 区 域 的 连通 性 、 
尺寸 .形状 等 几何 特性 。 物 体 的 几何 特性 对 描述 图 像 具 有 非常 重要 的 作用 ,图 像 的 描述 总 是 
以 被 描述 物体 的 某 些 特征 为 基础 的 。 

图 像 分 割 完 成 之 后 ,可 以 对 图 像 内 的 物体 进行 几何 特征 测量 和 分 析 , 进 而 用 于 对 物体 进 
行 识别 ,或 对 物体 进行 分 类 。 因 此 ,图 像 特 征 与 理解 具有 广泛 的 应 用 ,例如 ,可 以 用 于 工农 业 
生产 中 的 质量 监控 , 即 根据 识别 的 结果 判别 物体 是 否 符合 指定 的 标准 。 此 外 ,对 马 铃 葛 或 苹 
果 等 农产品 按 品 质 自 动 分 类 的 机 器 视觉 系统 ; 将 传送 带 上 不 同 工 件 自动 分 类 的 视觉 系统 等 
都 是 基于 图 像 特征 与 理解 方面 的 应 用 ,图 像 特 征 与 理解 也 是 机 器 视觉 的 主要 内 容 之 一 。 

本 章 围 绕 图 像 的 特征 与 理解 ,首先 介绍 图 像 的 几何 特征 、 形 状 特征 和 彩色 图 像 的 颜色 特 
征 , 然 后 介绍 图 像 形状 描述 子 ,纹理 特征 描述 以 及 曲线 曲面 拟 合 和 图 像 的 骨架 提取 等 。 


12.1 几何 特征 


图 像 的 几何 特征 是 指 图 像 中 物体 的 位 置 、 方 向 、 周 长 和 面积 等 方面 的 特征 。 尽 管 几何 特 
征 比较 直观 和 简单 ,但 在 图 像 分 析 与 理解 中 可 以 发 挥 重要 的 作用 。 提 取 图 像 几 何 特征 之 前 ， 
一 般 要 对 图 像 进 行 分 割 和 二 值 化 处 理 。 二 值 图 像 只 有 0 和 1 两 个 灰 度 级 ,便于 获取 、 分 析 和 
人 处理, 虽然 二 值 图 像 只 能 给 出 物体 的 轮廓 信息 ,但 在 图 像 分 析 和 计算 机 视觉 中 ,二 值 图像 及 
其 几何 特征 特别 具有 价值 ,可 用 来 完成 分 类 ,检验 、 定 位 、 轨 迹 跟踪 等 任务 。 


12.1.1 位 置 与 方向 


1. 位 置 

一 般 情况 下 ,图 像 中 的 物体 通常 并 不 是 一 个 点 ,因此 ,采用 物体 或 区 域 的 面积 的 中 心 点 
作为 物体 的 位 置 。 如 图 12-1 所 示 ,面积 中 心 就 是 单位 面积 质量 恒定 的 相同 形状 图 形 的 质 
心 O。 
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由 于 二 值 图 像 质量 分 布 是 均匀 的 , 故 质心 和 形 心 重合 。 若 图 像 中 的 物体 对 应 的 像素 位 
置 坐 标 为 (zi,yiD)(G 一 0,1,…,N 一 1; 7 一 0,1,…,M 一 1), 则 可 用 下 式 计 算 质 心 位 置 坐标 : 


C12-13 


2. 方向 

图 像 分 析 不 仅 需 要 知道 一 幅 图 像 中 物体 的 具体 位 置 ,而 且 还 要 知道 物体 在 图 像 中 的 方 
向 。 如 果 物 体 是 细 长 的 , 则 可 以 将 较 长 方向 的 轴 定 义 物体 的 方向 。 如 图 12-2 所 示 ,通常 ,将 
最 小 二 阶 矩 轴 定 义 为 较 长 物体 的 方向 。 


二 


| 


图 12-1 物体 的 位 置 图 12-2 物体 方向 的 最 小 惯量 轴 定义 


也 就 是 说 ,要 找 出 一 条 直线 ,使 下 式 的 值 最 小 : 
E= ||2/c,wdrdy (12-2) 


式 中 ,是 点 (z,y) 到 直线 (轴线 ) 的 垂直 距离 。 通 常情 况 下 ,确定 一 个 物体 的 方向 并 不 
是 一 件 容易 的 事情 ,需要 进行 一 定量 的 测量 。 


12.1.2 长 轴 与 短 轴 


若 区 域 或 物体 的 边界 已 知 , 则 可 以 采用 区 域 的 最 小 hy 
外 接 和 矩形 (mini-mum enclosing rectangle, MER) 的 尺寸 
来 描述 该 区 域 的 基本 形状 ,如 图 12-3 所 示 ,a 为 长 轴 ， 
0 为 短 轴 。 显 然 ,这 是 一 种 较 简单 的 形状 描述 方法 。 当 4 
物体 所 占 区 域 的 方向 与 坐标 轴 方 向 一 致 时 ,只 需 计 算 物 
体 边界 点 的 最 大 和 最 小 坐标 值 .就 可 得 到 物体 的 最 小 外 
接 和 矩形 .长 轴 和 短 轴 。 但 对 任意 朝向 的 物体 ,长 轴 和 短 
轴 可 能 与 坐标 轴 方 向 不 一 致 ,这 时 可 使 区 域 的 边界 施 图 12-3 物体 的 MER 及 长 轴 和 短 轴 
转 , 根 据 精度 要 求 , 每 旋转 一 定 角度 (如 3 或 5 等 ), 计 
算 一 次 坐标 轴 方 向 上 外 接 和 矩形 (不 一 定 是 MER) 的 尺寸 , 即 边界 点 最 大 最 小 x、y 值 距离 , 旋 
转 到 某 一 个 角度 后 ,外 接 矩 形 的 面积 达到 最 小 ,该 最 小 面积 的 外 接 矩 形 就 是 MER, 从 而 得 出 
长 轴 和 短 轴 数 据 。 另 外 ,还 可 以 通过 算 或 求 物体 的 最 佳 拟 合 直线 的 方法 求 出 长 轴 和 短 轴 
数据 。 


i 


出 
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12.1.3 周 长 


图 像 内 某 一 物体 或 区 域 的 周 长 是 指 该 物体 或 区 域 的 边界 长 度 。 一 个 形状 简单 的 物 
体 用 相对 较 短 的 周 长 来 包围 它 所 占有 面积 内 的 像素 , 即 周 长 是 围绕 所 有 这 些 像素 的 外 
边界 的 长 度 。 通 常 , 测 量 周 长 会 包含 物体 内 多 个 90 "的 转弯 ,这 些 拐弯 一 定 程度 上 扩大 
了 物体 的 周 长 。 物 体 或 区 域 的 周 长 在 区 别 某 些 简单 或 复杂 形状 的 物体 时 具有 重要 
价值 。 

由 于 周 长 的 表示 方法 不 同 ,因而 计算 周 长 的 方法 也 有 所 不 同 。 计 算 周 长 常 用 的 3 种 方 
法 分 别 如 下 : 

(1) 若 将 图 像 中 的 像素 视 为 单位 面积 小 方块 时 , 则 图 
像 中 的 区 域 和 背景 均 由 小 方块 组 成 。 区 域 的 周 长 即 为 区 域 
和 背景 缝隙 的 长 度 之 和 ,此 时 边界 用 隙 码 表示 ,计算 出 隙 码 
的 长 度 就 是 物体 的 周 长 。 如 图 12-4 所 示 图 形 , 边 界 用 际 码 
表示 时 , 周 长 为 24。 

(2) 若 将 像素 视 为 一 个 个 点 时 , 则 周 长 用 链 码 表示 , 求 
周 长 也 就 是 计算 链 码 的 长 度 。 当 链 码 值 为 奇数 时 ,其 长 度 
为 V2 ; 当 链 码 值 为 偶数 时 ,其 长 度 为 1, 即 周 长 p 可 表示 为 

p= N.+V2N, (12-3) 

式 中 ,N, 和 NN, 分 别 是 边界 链 码 (8 方向) 中 走 偶 步 与 走 奇 步 的 数目 。 以 图 12-4 为 例 ， 
边界 用 链 码 表示 时 ,物体 的 周 长 为 10 十 5V2 。 

周 长 也 可 以 简单 地 从 物体 分 块 中 通过 计算 边界 上 相 邻 像素 的 中 心 距离 之 和 得 出 。 

(3) 周 长 用 边界 所 占 面积 表示 时 , 周 长 即 物体 边界 点 数 之 和 ,其 中 每 个 点 位 占 面积 为 1 
的 一 个 小 方块 。 以 图 12-4 为 例 ,边界 以 面积 表示 时 ,物体 的 周 长 为 15 。 


12.1.4 面积 


面积 是 衡量 物体 所 占 范围 的 一 种 方便 的 客观 度量 。 面 积 与 其 内 部 灰 度 级 的 变化 无 关 ， 
而 完全 由 物体 或 区 域 的 边界 决定 。 同 样 面积 条 件 下 ,一 个 形状 简单 的 物体 其 周 长 相 对 较 短 。 

1. 像素 计数 法 

最 简单 的 面积 计算 方法 是 统计 边界 及 其 内 部 的 像素 的 总 数 。 根 据 面 积 的 像素 计数 法 的 
定义 方式 ,物体 面积 的 计算 非常 简单 , 求 出 物体 边界 内 像素 点 的 总 和 即 为 面积 。 计 算 公式 为 

用 一作) 福 ) jzao (12-4) 

对 二 值 图 像 而 言 , 若 1 表示 物体 的 像素 ,而 0 表示 音 景 像素 , 则 面积 就 是 统计 f(z,y) 一 1 
的 像素 数量 。 

2. 边界 行程 码 计 算法 

由 各 种 封闭 边界 区 域 的 描述 来 计算 面积 也 很 方便 ,面积 的 边界 行程 码 计 算法 可 分 如 下 
两 种 情况 : 

(1) 车 已 知 区 域 的 行程 编码 , 则 只 需 将 值 为 1 的 行程 长 度 相 加 , 即 为 区 域 面 积 。 


图 12-4 物体 周 长 的 计算 
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(2) 若 已 知 某 区 域 封闭 边界 的 某 种 表示 , 则 相应 连通 区 域 的 面积 为 区 域外 边界 包围 的 
面积 与 内 边界 包围 的 面积 ( 孔 的 面积 ) 之 差 。 

若 采用 边界 链 码 表示 面积 ,面积 计算 方法 如 下 : 

设 屏幕 左上 角 为 坐标 原点 ,区 域 起 始点 坐标 为 (zu,yo), 则 第 & 段 链 码 终端 的 纵 坐 标 


2 为 
[3 
yr = + 2 Ays (12-5) 
i=1 
式 中 
一 1 = ;3 
Ay = ' e =0,4 (12-6) 
ef =5,6,7 
si 是 第 i 个 码 元 。 设 
一 1 ee 一 3,4,5 
Arzri = si 一 2,6 0 
1 &€=0,1,7 
于 5 一 1,5 
a= 10 € = 0,2,4,6 (12-8) 
一 序 € 一 3,7 


则 相应 边界 所 包围 的 面积 为 
A= Do 1Axi 十 a) (12-9) 
应 用 式 (12-9) 面 积 公 式 计算 的 面积 ， 即 以 链 码 表 示 边界 时 边界 内 所 包含 的 单元 方 格 数 。 
3. 边界 坐标 计算 法 
面积 的 边界 坐标 计算 法 采用 高 等 数学 中 的 格林 公式 进行 计算 ,在 x-y 平面 上 ,一 条 封闭 
曲线 所 包围 的 面积 为 
A= dherdy — ydz) (12-10) 


其 中 ,积分 沿 着 该 闭合 曲线 进行 。 对 于 数字 图 像 , 可 将 上 式 离散 化 ,因此 可 得 


N 
A 于 > [zy yi) 一 %i(Czai — Zi)] 
i=1 


N 
= Dy — yizin) (12-11) 
t= 
式 中 ,N 为 边界 点 数 。 


12.1.5 距离 


图 像 中 两 点 Pi (zi,y) 和 P:(zs'yz) 之 间 的 距离 是 重要 的 几何 性 质 之 一 ,图像 处 理 中 
的 距离 度量 方法 在 2. 4. 3 节 中 已 介绍 ,常用 的 主要 包括 欧 氏 距离 (又 称 为 欧 几 里 得 距离 ) 、 城 
市 距离 (又 称 为 市 区 距离 ) 和 棋盘 距离 3 种 方法 。 
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1. 欧 几 里 得 距离 
da(P,P:) = V(xi— zx2) :+ (yO y)’ (12-12) 


这 是 几何 学 中 常用 的 距离 测量 方法 ,在 数字 图 像 处 理 中 ,由 于 欧 几 里 得 距离 包含 有 平方 
和 开 方 运算 ,因而 较 少 被 采用 。 


2. 市 区 距离 
di(Pi,P:) =| xi—z | 十 | 一 | (12-13) 
di(CPi,P:)( 包 括 下 面 介绍 的 ds CP,,P:)) 由 于 计算 较为 简便 ,上 且 为 正 整数 ,因此 常用 来 
测量 距离 。 
3. 棋盘 距离 
ds(P1i,P:) = max(| za 一 zl 一 2 1) (12-14) 


如 图 12-5(a) 所 示 , 设 中 心 点 O 所 在 的 位 置 为 PCziyy ) ,显然 ,以 PCzyy ) 为 起 点 的 
市 区 距离 形成 以 Pi 为 中 心 的 萎 形 距离 图 形 。 图 12-5(a) 为 di (Pi,P;) 距 离 小 于 3 时 的 市 
区 距离 菱形 图 。 可 见 ,d (P,,P,) 是 从 P, 到 P, 最 短 的 4 路 径 的 长 度 。 同 样 , 以 Pi 为 起 点 
的 棋盘 距离 形成 以 Pi 为 中 心 的 正方 形 。 图 12-5(b) 所 示 为 ds (Pi, Ps) 小 于 等 于 3 时 的 棋 
盘 距 离 正方 形 图 形 。 同 样 由 图 可 见 ds (Pi ,P:) 是 从 Pi 到 P, 最 短 的 8 路 径 的 长 度 。 


3 : 
:| 二 人 
-0 苏区 交 了 让 区 富 
:1 3 多 二 
F 受 - 演 各 法 半生 枚 邹 
计时 吕 : 要 和 部 
8 : .3 3 入- 和 过 当 

(a) (b) 


图 12-5 dd, (P,P;) 和 ds (P,P;) 表 示 方 法 


12.2 形状 特征 


物体 的 形状 特征 主要 包括 矩形 度 、 宽 长 比 、 圆 形 度 ,球状 性 ,不 变 矩 和 偏心 率 等 。 物 体 从 
图 像 中 分 割 出 来 以 后 ,将 形状 特征 与 几何 特征 结合 起 来 ,在 机 器 视觉 系统 中 起 着 十 分 重要 的 
作用 , 它 可 以 作为 区 分 不 同 物体 的 依据 之 一 。 
忆 


12.2.1 矩形 度 AMER 


物体 的 矩形 度 指 物体 的 面积 与 其 最 小 外 接 矩 形 的 | 
面积 之 比值 。 如 图 12-6 所 示 ,矩形 度 反 映 了 一 个 物体 WW 
对 其 外 接 和 矩形 的 充满 程度 。 
矩形 度 的 定义 为 
A 下 | 


电 一 -一 一 (12-15) 
A ner 


式 中 ,A。 是 该 物体 的 面积 ; Aver 是 物体 的 最 小 外 接 甜 图 12-6 ”物体 的 最 小 外 接 矩 形 


加 | 
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形 (MER) 的 面积 。 
R 的 值 在 0 一 1 之 间 , 当 物体 为 矩形 时 ,R 取得 最 大 值 1.0。 圆 形 物 体 的 矩形 度 取 值 为 
r/4, 细 长 和 弯曲 物体 的 尺 值 较 小 。 


12.2.2 宽 长 比 
宽 长 比 是 指 物体 的 最 小 外 接 矩 形 的 宽 与 长 之 比值 。 根 据 图 12-6 可 得 , 宽 长 比 7 为 
二 La (12-16) 


利用 > 可 以 将 细 长 的 物体 与 贺 形 或 方形 的 物体 区 分 开 来 。 
12.2.3 ” 圆 形 度 
贺 形 度 包 括 周 长 平 方面 积 比 .边界 能 量 、 圆 形 性 、 面 积 与 平均 距离 平方 之 比值 等 。 圆 形 
度 可 以 用 来 刻画 物体 边界 的 复杂 程度 。 
1. 周 长 平 方面 积 比 
周 长 平 方面 积 比 是 度量 圆 形 度 最 常用 的 指标 ,又 称 为 致密 度 , 即 周 长 的 平方 与 面积 之 比值 ， 


2 
c= 所 (12-17) 


式 中 ,P 表示 物体 的 周 长 ; A 表示 面积 。 

2. 边界 能 量 

边界 能 量 是 圆 形 度 的 重要 指标 之 一 。 设 物体 的 周 
长 为 P, 以 变量 p 表示 边界 上 的 点 到 某 一 起 始点 的 距 
离 。 边 界 上 任意 点 都 有 一 个 对 应 的 曲率 半径 , 即 该 点 与 
物体 边界 相 切 的 圆 的 半径 ,如 图 12-7 所 示 , 以 r(p) 表 
示 曲 率 半径 , 则 pp 点 的 曲率 函数 为 

函数 K(p) 是 周期 函数 ,其 周期 为 P。 可 采用 下 式 ”图 12-7 物体 边界 点 的 曲率 半径 
计算 单位 边界 长 度 的 平均 能 量 : 


Y= 


K(p) = (12-18) 


趟 := spf | KCp) lidp (12-19) 
PJ 
当 不 同 物体 具有 相同 面积 时 , 圆 具 有 最 小 边界 能 量 : 
E= (的 本 志 (12-20) 


式 中 ,R 为 圆 的 半径 。 曲 率 可 以 很 容易 地 由 链 码 算出 ,因而 边界 能 量 也 可 方便 地 求 出 。 
3. 圆 形 性 
圆 形 性 (circularity)c 是 一 个 用 物体 或 区 域 R 的 所 有 边界 点 定义 的 特征 量 , 即 


三 径 有 
(12-21) 


戒 申 


天 一 1 
而 三 王 2 外 Easy 一 合 画 下 (12-22) 
Ki 


出 
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Le 是 从 区 域 重心 到 边界 点 的 平均 距离 ; 


天 一 1 
6x = 让 Grisy) 一 全) 下 一 pe 了 (12-23) 
k=0 


6 是 从 区 域 重心 到 边界 距离 的 均 方差 。 

当 物 体 所 占 区 域 R 趋向 圆 形 时 ,特征 量 c 是 单调 递增 且 趋 向 无 穷 , 且 不 受 区 域 平 移 、 旋 
转 和 尺度 变化 的 影响 。 

4. 面积 与 平均 距离 平方 比值 

面积 与 平均 距离 平方 比值 g 也 是 圆 形 度 的 度量 指标 ,其 定义 为 

三 第 三 到: 
5 (12-24) 

式 中 ,z 是 从 具有 N 个 点 的 物体 中 的 第 ; 个 点 到 与 其 最 近 的 边界 点 的 距离 。 该 定义 利用 了 
从 边界 上 的 点 到 物体 内 部 某 点 的 平均 距离 4 , 即 


N 


d= EE (12-25) 
1 


1 
N 


12.2.4 球状 度 


球状 度 又 称 为 球状 性 (sphericity), 它 既 可 以 用 于 描述 二 维 物 体 也 可 以 描述 三 维 物 体 ， 

球状 度 以 S 表示 ,其 定义 为 
疡 二 ee (12-26) 

如 图 12-8 所 示 , 对 于 二 维 物 体 ,x; 代表 区 域内 切 
圆 (inscribed-circle) 的 半径 ,而 r. 表示 区 域外 接 圆 
(circumscribed-circle) 的 半径 ,两 圆 的 圆心 都 在 物体 区 
域 的 重心 上 。 

当 二 维 物体 为 圆 形 时 ,物体 的 球状 性 值 S 达到 最 
大 值 1.0, 而 当 区 域 为 其 他 形状 时 , 则 S 二 1.0。 球 状 性 
不 受 物体 平移 .旋转 和 尺度 变化 的 影响 。 


12.2.5 不 变 矩 图 12-8 ”球状 性 定义 示意 图 


矩 在 物理 学 和 工程 上 具有 重要 的 理论 意义 和 应 用 价值 ,图 像 像素 的 某 些 矩 对 于 平移 . 旋 
转 ` 尺 度 等 几何 变换 具有 许多 不 变 特性 ,因此 矩 的 表示 方法 在 物体 分 类 与 识别 中 具有 重要 
1. 给 的 定义 
对 于 二 维 图 像 函 数 /(x,y) ,其 j 十 k 阶 矩 定义 为 
i = [ayadrdy i (12-27) 
了 和 上 可 取 所 有 的 非 负 整数 值 , 参 数 ) 十 上 称 为 矩 的 阶 。 其 中 , 零 阶 矩 是 物体 的 面积 , 即 
vy ol a 下 ee (12-28) 
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对 二 维 离散 函数 序列 fFCz,y) , 零 阶 矩 可 表示 为 
N M 
Mo = >) Pfr,y) (12-29) 


当 取 不 同 值 时 ,函数 f(z,y) 的 各 阶 矩 形成 了 一 个 矩 的 无 限 集 , 即 集合 对 于 函数 f(z,y) 
是 唯一 的 ,根据 该 集合 完全 可 以 确定 函数 f(z,y)。 为 了 描述 物体 的 形状 ,假设 /(z,y) 的 目 
标 物 体 取 值 为 1, 背景 为 0, 即 函数 只 反映 了 物体 的 形状 而 忽略 其 内 部 的 灰 度 级 细节 。 

2. 质心 坐标 与 中 心 矩 

当 j 王 1,k 二 0,Mi。 对 二 值 图 像 而 言 即 物体 上 所 有 点 的 横 坐 标 z 的 总 和 ,Mo 是 物体 上 所 
有 点 的 纵 坐标 y 的 总 和 。 物 体 的 各 阶 和 矩 除 以 Mo 以 后 ,与 物体 的 大 小 无 关 。 而 一 阶 矩 除 以 
Mo ,就 是 二 值 图 像 内 一 个 物体 的 质心 的 坐标 , 即 


(12-30) 


为 了 获得 矩 的 不 变 特征 ,通常 采用 中 心 逢 以 及 归 一 化 的 中 心 逢 。 中 心 矩 的 定义 为 


M 
pr = DD) Ci) yy— Wf zr,y) (12-31) 


z=1 y=1 


式 中 ,zx 、y 是 物体 的 质心 。 如 果 was 二 poz* 则 区 域 可 能 是 沿 zx 轴 方 向 伸 长 的 区 域 ,如 yo 二 0， 
则 区 域 关 于 xz 轴 对 称 ,如 果 yo 三 0, 则 区 域 关 于 y 轴 对 称 , 这 种 特征 可 用 于 测量 简单 的 形状 。 


3. 主轴 
使 二 阶 中 心 矩 wa 变 得 最 小 的 旋转 角 0 可 以 由 下 式 得 出 : 
tan20 一 二 (12-32) 
将 zy 轴 分 别 旋转 角度 0 得 坐标 轴 zx"、y' 称 为 该 物体 的 主轴 。 式 (12-32) 中 ,0 为 90 时 
的 不 确定 性 可 以 通过 如 下 限定 条 件 解决 : 


pazo = puo2 
(12-33) 
pao 二 0 


如 果 物 体 在 计算 矩 之 前 旋转 0 角 ,或 相对 于 zy 轴 计 算 矩 , 则 矩 具有 旋转 不 变性 。 

4. 不 变 和 矩 

相对 于 主轴 计算 采用 面积 归 一 化 的 中 心 矩 ,在 物体 放大 平移、 旋转 时 保持 不 变 , 而 三 阶 
或 更 高 阶 的 矩 经 过 这 样 的 规 一 化 后 不 能 保持 不 变性 。 

对 于 JJ 十 & 一 2,3,4,…, 时 称 为 高 阶 矩 ,对 于 高 阶 距 可 以 定义 如 下 归 一 化 的 中 心 矩 ， 


的 
pr = 0 (12-34) 

式 中 
蓉 圭 (3 (12-35) 


利用 归 一 化 的 中 心 矩 ,可 以 获得 不 变 矩 的 多 种 组 合 ,这 些 组 合 对 于 平移 .旋转 ` 尺 度 等 变 
换 都 具有 不 变性 。 


因 
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不 变 矩 具备 了 一 个 好 的 形状 特征 所 具有 的 某 些 性 质 。 物 体形 状 的 唯一 性 体现 在 一 个 矩 
的 无 限 集中 ,因此 ,要 区 别 相似 的 形体 需要 一 个 很 大 的 特征 集 。 这 样 所 产生 的 高 维 分 类 器 对 
噪声 和 类 内 变化 十 分 敏感 。 在 某 些 情况 下 ,其 他 阶 数 相对 较 低 的 矩 可 以 反映 一 个 物体 的 重 
要 形状 特征 。 不 变 矩 特性 已 经 应 用 于 印刷 体 字符 的 识别 .飞机 形状 区 分 .景物 匹配 和 染色 体 
分 析 之 中 。 


12.2.6 偏心 率 


偏心 率 (eccentricity) 又 称 为 伸 长 度 (elongation)， 
它 是 区 域 形 状 的 一 种 重要 描述 方法 。 偏 心率 在 一 定 程 
度 上 反映 了 一 个 区 域 的 紧凑 性 。 偏 心率 有 多 种 计算 公 


式 , 一 种 常用 的 计算 方法 是 区 域 长 轴 ( 主 轴 ) 长 度 与 短 


轴 ( 辅 轴 ) 长 度 的 比值 ,如 图 12-9 所 示 , 即 图 12-9 偏心 率 度量 
E= 全 (12-36) 
图 12-9 中 ,长 轴 与 短 轴 相互 垂直 ,其 长 度 分 别 是 两 个 方向 的 最 大 值 , 这 种 定义 受 物 体形 
状 和 噪声 的 影响 较 小 。 


偏心 率 的 另 一 种 方法 是 计算 惯性 主轴 比 , 它 基 于 边界 线 上 的 点 或 整个 区 域 来 计算 质量 。 
特 南 鲍 姆 CTenebaum) 提 出 了 计算 任意 区 域 的 偏心 度 的 近似 公式 ,一 般 过 程 如 下 : 
1) 计算 平均 向 量 


(12-37) 
2) 计算 j 十 k 阶 中 心 矩 
N N 
Mi = 2 2) Cri— x0) (yi — yo)* (12-38) 
i=1 i=1 
3) 计算 方向 角 
-和 
= 二 (a 十 亚 N (12-39) 
4) 计算 偏心 度 近 似 值 
E — Ma — Ma) + 4Ms em 


A 


12.3 颜色 特征 


颜色 特征 是 图 像 检索 、 图 像 识别 与 分 类 中 应 用 广泛 的 重要 视觉 特征 ,主要 原因 在 于 颜色 
往往 和 图 像 中 所 包含 的 物体 或 场景 十 分 相关 。 与 其 他 视觉 特征 相 比 ,颜色 特征 对 图 像 自身 
的 某 些 几何 形状 特性 ,如 尺寸 .方向 ,视角 的 依赖 性 较 小 ,从 而 具有 较 高 的 鲁 棒 性 。 

颜色 特征 是 一 种 全 局 特征 ,描述 了 图 像 或 图 像 内 区 域 所 对 应 的 景物 的 表面 性 质 。 颜 色 
特征 一 般 是 基于 像素 点 的 特征 ,此 时 所 有 属于 图 像 或 图 像 区域 的 像素 都 有 各 自 的 贡献 。 由 
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于 颜色 对 图 像 或 图 像 区 域 的 方向 ,大 小 等 变化 不 敏感 ,所 以 颜色 特征 不 能 很 好 地 捕捉 图 像 中 
对 象 的 局 部 特征 。 另 外 , 仅 使 用 颜色 特征 识别 图 像 时 ,如 果 数 据 库 很 大 ,可 能 将 许多 不 需要 
的 图 像 也 检索 出 来 。 颜 色 直方 图 是 最 常用 的 表达 颜色 特征 的 方法 ,其 优点 是 不 受 图 像 旋转 
和 平移 变化 的 影响 ,基于 归 一 化 的 直方 图 还 可 不 受 图 像 尺度 变化 的 影响 ,其 缺点 是 没有 表达 
出 颜色 空间 分 布 的 信息 。 颜 色 特征 常用 的 特征 提取 与 匹配 方法 主要 包括 颜色 直方 图 、 颜 色 
集 .颜色 矩 .颜色 聚合 向 量 和 颜色 相关 图 。 


12.3.1 颜色 直方 图 


颜色 直方 图 是 很 多 图 像 检索 系统 中 广泛 采用 的 颜色 特征 ,直方 图 描述 了 不 同色 彩 在 整 
幅 图 像 中 所 占 的 比例 ,而 并 不 关心 每 种 色彩 所 处 的 空间 位 置 ,在 几何 特征 上 具有 较 好 的 鲁 棒 
性 。 但 颜色 直方 图 由 于 失去 了 R、G、B 亮度 值 的 位 置 对 应 关系 ,因而 无 法 描述 图 像 中 的 对 
象 或 物体 。 因 此 ,颜色 直方 图 一 般 适合 于 描述 一 些 难 以 进行 自动 分 割 的 图 像 。 

由 于 计算 机 具有 多 种 颜色 模型 ,因此 ,颜色 直方 图 也 可 以 基于 不 同 的 颜色 空间 和 坐标 
系 , 最 常用 的 颜色 空间 是 RGB 颜色 空间 ,然而 ,RGB 空间 结构 并 不 符合 人 们 对 颜色 相似 性 
的 主观 判断 。 因 此 ,基于 HSV 空间 、Luv 空间 和 Lab 空间 的 颜色 直方 图 也 常常 被 采用 ,这 
些 颜 色 空 间 更 接近 于 人 们 对 颜色 的 主观 认识 。 例 如 ,在 颜色 直方 图 应 用 中 ,HSYV 空间 是 直 
方 图 最 常用 的 颜色 空间 , 它 的 三 个 分 量 分 别 代表 色彩 (hue)、 饱 和 度 (saturation) 和 值 
(value)。 

计算 颜色 直方 图 需要 将 颜色 空间 划分 成 若干 个 小 的 颜色 区 间 ( 又 称 为 一 个 柄 ) ,每 个 小 
区 间 成 为 直方 图 的 一 个 bin。 这 个 过 程 称 为 颜色 量化 (color quantization) ,通过 统计 颜色 落 
在 每 个 小 区 间 内 的 像素 数量 可 以 得 到 颜色 直方 图 。 颜色 量化 有 很 多 方法 ,如 向 量 量 化 、 聚 类 
方法 或 者 神经 网 络 方法 都 常 被 采用 。 常 用 的 量化 方法 是 将 颜色 空间 的 各 分 量 进 行 均匀 量 
化 。 聚 类 算法 需要 考虑 图 像 颜色 特征 在 整个 空间 中 的 分 布 情况 ,从 而 避免 出 现 某 些 区 间 的 
像素 数量 非常 稀疏 的 情况 ,使 量化 更 为 有 效 。 另 外 ,如 果 图 像 是 RGB 格式 而 直方 图 是 基于 
HSYV 空间 , 则 可 以 先 建立 从 量化 的 RGB 空间 到 量化 的 HSV 空间 之 间 的 查找 表 (look-up 
table) ,从 而 加 快 直方 图 的 计算 过 程 。 

上 述 的 颜色 量化 方法 会 产生 一 定 的 问题 。 设 想 两 幅 图 像 的 颜色 直方 图 几乎 相同 ,只 是 
互相 错开 了 一 个 量化 区 间 , 这 时 如 果 采 用 Li 距离 或 者 欧 拉 距离 计算 两 者 的 相似 度 , 会 得 到 
很 小 的 相似 度 值 。 为 了 克服 这 个 缺陷 ,需要 考虑 到 相似 但 不 相同 的 颜色 之 间 的 相似 度 。 一 
种 方法 是 采用 二 次 式 距 离 。 另 一 种 方法 是 对 颜色 直方 图 事先 进行 平滑 过 滤 , 即 每 个 区 间 中 
的 像素 对 于 相 邻 的 几 个 区 间 也 有 贡献 。 这 样 , 相 似 但 不 相同 颜色 之 间 的 相似 度 对 直方 图 的 
相似 度 也 有 所 贡献 。 

选择 合适 的 颜色 量化 区 间 数 目 和 颜色 量化 方法 ,应 考虑 具体 应 用 的 性 能 和 效率 要 求 。 
一 般 来 说 ,颜色 量化 区 间 的 数目 越 多 ,直方 图 对 颜色 的 分 辩 能 力 就 越 强 。 然 而 ,量化 的 区 间 
数目 过 大 ,不 仅 颜 色 直 方 图 的 计算 会 增加 很 多 ,可 能 反而 不 利于 在 大 型 图 像 库 中 建立 索引 ， 
对 于 某 些 特殊 情况 ,使 用 过 大 的 颜色 量化 方法 不 一 定 能 够 提高 检索 和 识别 效果 。 一 种 有 效 
减少 直方 图 颜色 量化 区 间 数 的 办 法 是 只 选用 那些 像素 数量 最 多 的 子 区 间 来 构造 图 像 特 征 ， 
因为 图 像 的 主体 颜色 是 由 像素 数量 最 大 的 若干 子 区 间 所 呈现 的 。 实 验证 明 , 这 种 方法 并 不 
会 降低 颜色 直方 图 的 检索 效果 ,由 于 忽略 了 那些 少数 像素 的 区 间 ,颜色 直方 图 对 噪声 的 鲁 棒 
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性 提高 了 ,有 时 会 使 检索 效果 更 好 。 


12.3.2 颜色 集 


颜色 直方 图 法 是 一 种 基于 纯 统计 学 意义 的 全 局 颜色 特征 提取 与 匹配 方法 , 较 好 地 描述 
了 图 像 在 颜色 方面 的 宏观 特征 信息 ,但 却 无 法 区 分 图 像 的 局 部 颜色 信息 。 为 支持 大 规模 图 
像 库 进 行 更 精细 的 图 像 检 索 ,Smith 和 Chang 用 颜色 集 (color set) 作为 颜色 直方 图 的 一 种 
近似 和 改进 。 

颜色 集 的 提取 方法 是 ,首先 将 图 像 从 RGB 颜色 空间 转化 成 视觉 均衡 的 颜色 空间 (如 
HSYV 空间 ) ,并 将 颜色 空间 量化 成 若干 个 柄 。 然 后 ,用 色彩 自动 分 割 技术 将 图 像 分 为 若干 区 
域 , 每 个 区 域 用 量化 颜色 空间 的 某 个 颜色 分 量 来 索引 ,从 而 将 图 像 表 达 为 一 个 二 进 制 的 颜色 
索引 集 。 在 图 像 匹 配 中 ,比较 不 同 图 像 颜 色 集 之 间 的 距离 和 色彩 区 域 的 空间 关系 ,包括 区 域 
的 分 离 .包含 和 交 。 因 为 颜色 集 的 表达 为 二 进 制 的 特征 向 量 , 便 于 构建 二 分 查找 树 来 加 快 检 
索 速度 ,这 对 于 大 规模 的 图 像 数 据 库 非 常 有 利 。 


12.3.3 颜色 矩 


颜色 是 彩色 图 像 最 重要 特征 之 一 ,被 广泛 用 于 图 像 检 索 中 。 但 从 图 像 中 提取 颜色 特征 
时 ,很 多 算法 都 先 要 对 图 像 进 行 量化 处 理 。 量 化 处 理 容易 导致 误 检 , 尤 其 是 图 像 特 征 维 数 越 
高 ,对 检索 越 不 利 。 

针对 彩色 图 像 检 索 的 特征 ,Stricker 和 Oreng 提出 了 颜色 矩 的 方法 ,颜色 矩 是 一 种 简单 
有 效 的 颜色 特征 表示 方法 ,有 一 阶 窍 (mean)、 二 阶 矩 (viarance) 和 三 阶 矩 ( 斜 度 ,skewness) 
等 ,由 于 颜色 信息 主要 分 布 于 低 阶 矩 中 ,所 以 用 一 阶 矩 、 二 阶 矩 和 三 阶 矩 足以 表达 图 像 的 颜 
色 分 布 ,颜色 矩 已 证 明 可 有 效 地 表示 图 像 中 的 颜色 分 布 。 因 此 ,图 像 的 颜色 矩 一 共 只 需要 
9 个 分 量 , 即 RG、B 3 个 颜色 分 量 , 每 个 分 量 包 括 3 个 低 阶 矩 。 颜 色 矩 的 数学 定义 为 


本 
一 下 2 (12-41) 
a GP 一 0 (12-42) 
$= (BE -m7 ] (12-43) 
式 中 ,N 表示 图 像 中 像素 点 的 总 数 ; ps 表示 第 i 个 颜色 通道 中 第 j 个 灰 度 级 的 像素 点 出 现 


的 概率 。 
以 YUV 颜色 空间 为 例 ,3 个 颜色 分 量 的 3 个 低 阶 矩 可 以 组 成 一 个 如 下 所 示 的 9 维 直方 
图 向 量 : 
(py »0y »Sy rfU OU » SU sv r0v » sv) (12-44) 
与 其 他 的 颜色 特征 相 比 ,颜色 矩 具 有 简洁 方便 的 特点 。 该 方法 不 需要 颜色 空间 量化 ， 
特征 向 量 维 数 低 。 但 是 ,这 种 简单 性 也 产生 了 缺点 ,实验 发 现 该 方法 的 检索 效率 比较 低 , 实 
际 应 用 中 一 般 用 颜色 矩 进行 第 一 次 检索 ,去 掉 那 些 在 颜色 上 极 不 相似 的 图 像 , 从 而 缩小 检索 
范围 。 
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12.3.4 颜色 聚合 向 量 


针对 颜色 直方 图 和 颜色 矩 无 法 表达 图 像 色 彩 的 空间 位 置 的 缺点 ,Pass 提出 了 图 像 的 颜 
色 聚 合 向 量 (color coherence vector,CCV) 作 为 图 像 特征 。CCV 是 颜色 直方 图 的 一 种 演变 ， 
其 核心 思想 是 将 属于 直方 图 每 一 个 bin 的 像素 分 为 两 部 分 : 如 果 该 bin 内 的 某 些 像素 所 占 
据 的 连续 区 域 的 面积 大 于 给 定 的 阔 值 , 则 该 区 域内 的 像素 作为 聚合 像素 ,否则 作为 非 聚 合 像 
素 。 假 设 ai 与 B; 分 别 代表 直方 图 的 第 i 个 bin 中 聚合 像素 和 非 聚合 像素 的 数量 ,图 像 的 颜 
色 聚 合 向 量 可 以 表达 为 ((w ,B) ,(az ,应 ),…,(CawBv))。 而 (ai 十 记 ,az 十 应 ,an 十 Pv) 就 
是 该 图 像 的 颜色 直方 图 。 

CCV 实现 了 将 聚合 像素 和 非 聚 合 像素 单独 处 理 , 从 而 保留 了 图 像 颜 色 的 一 定 的 空间 分 
布 信息 ,由 于 包含 了 颜色 分 布 的 空间 信息 ,颜色 聚合 向 量 相 比 颜色 直方 图 的 检索 效果 更 好 ， 
特别 是 对 于 具有 大 区 域 均 匀 分 布 的 图 像 和 大 部 分 为 纹理 信息 的 图 像 ,检索 效果 更 好 。 


12.3.5 颜色 相关 图 


颜色 相关 图 (color correlogram) 是 图 像 颜色 分 布 的 另 一 种 表达 方式 。 这 种 特征 不 但 刻 
画 了 某 一 种 颜色 的 像素 数量 占 整 个 图 像 的 比例 ,还 反映 了 不 同 颜色 对 之 间 的 空间 相关 性 。 
实验 表明 ,颜色 相关 图 比 颜色 直方 图 和 颜色 聚合 向 量具 有 更 高 的 检索 效率 ,特别 是 查询 空间 
关系 一 致 的 图 像 。 

如 果 考 虑 到 任何 颜色 之 间 的 相关 性 ,颜色 相关 图 会 变 得 非常 复杂 和 庞大 ,空间 复杂 度 为 
OCN2d) 。 一 种 简化 的 变种 是 颜色 自动 相关 图 (color auto-correlogram) , 它 仅仅 考察 具有 相 
同 颜色 的 像素 间 的 空间 关系 ,因此 空间 复杂 度 降 到 OCNa) 。 


12.4 形状 描述 子 


对 物体 进行 描述 时 ,有 时 希望 能 使 用 一 些 比 单个 参数 提供 更 丰富 的 细节 ,而 又 比 用 图 像 
本 身 更 简明 的 方法 来 描述 物体 的 形状 ,这 就 是 形状 描述 子 , 它 可 以 对 物体 形状 进行 简洁 的 描 
述 。 形 状 描述 子 包括 傅 里 叶 描 述 子 ,边界 链 码 微分 链 码 等 。 


12.4.1 传 里 叶 描 述 子 


物体 边界 的 离散 傅 里 叶 变 换 序列 可 以 作为 定量 描述 |， 本 关 
边界 形状 的 有 效 方法 , 傅 里 叶 描 述 子 (Fourier descriptor， 
FD) 是 目前 形状 表示 方法 中 应 用 最 多 的 描述 子 之 一 。 采 2 a 
用 传 里 叶 描述 的 优点 是 可 以 将 二 维 问题 转化 为 一 维 问题 ， : . 
即将 xz-y 平面 中 的 曲线 段 转化 为 一 维 函 数 ,或 将 zy 平面 Ws, i 
中 的 曲线 段 转化 为 复 平面 上 的 一 个 序列 ,即将 zy 平面 与 = 可 
复 平 面 重合 ,其 中 , 实 轴 与 zx 轴 重 合 . 虚 轴 与 y 轴 重 合 。 这 图 12-10 边界 点 的 复数 表示 
样 可 用 复数 zi 十 jy 的 形式 来 表示 给 定 边界 上 的 每 个 点 
(zx,y)。 如 图 12-10 所 示 ,这 两 种 表示 实质 是 一 致 的 ,是 点 对 点 的 一 一 对 应 映射 关系 。 
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根据 以 上 分 析 , 设 物体 的 边界 是 由 N 个 点 组 成 的 封闭 边界 ,从 任 一 点 开始 绕 边 界 一 周 
就 得 到 一 个 复数 序 zs 十 jy ; 即 
s(k) = ztijye 一 0,1,2,…,N 一 1 (12-45) 
复数 序列 *(&) 称 为 傅 里 叶 描 述 子 (FD)。 序 列 *CA) 的 DFT 变换 为 


N=1 
S(w) 一 调 22s(hDe w=0,1,2,…,N—1 (12-46) 


k=0 
傅 里 叶 描述 不 必 考 虑 其 原始 形状 的 大 小 、 位 置 及 方向 。 例 如 , 若 要 改变 轮廓 大 小 ,只 要 
把 FD 乘 一 个 常数 就 可 以 了 。 由 于 傅 里 叶 变 换 是 线性 的 , 它 的 反 变换 也 需 乘 以 同样 的 常数 。 
若 将 区 域 轮廓 旋转 一 个 角度 ,只 需 将 每 一 个 坐标 乘 以 名 就 可 以 使 其 旋转 0 角 。 由 DFT 的 性 
质 ,在 空域 旋转 了 0 角 ,在 频 域 中 也 会 旋转 0 角 。 关 于 轮廓 起 始点 的 移动 ,由 DFT 的 周期 性 
可 以 看 到 ,在 空域 中 的 有 限 数字 序列 实际 上 代表 周期 函数 的 一 个 周期 。 
S(w) 也 可 称 为 边界 的 伟 里 叶 描 述 , 其 逆 变 换 为 


N-1 
sD) 二 调 2SCo)e? k=0,1,2,,N—1 (12-47) 
w=0 


由 于 离散 傅 里 叶 变 换 是 一 种 可 道 线 性 变换 ,而 且 在 变换 过 程 中 具有 很 多 优秀 的 特性 , 因 
此 ,这 一 特点 为 边界 描述 提供 了 方便 。 车 S(w) 只 取 频 率 域 的 M 个 值 , 即 取 S(w) 的 前 M 个 
系数 同样 可 求 出 s(k) 的 一 组 近似 值 5(k)。 
M-l 
SCk) = 育 22SCo)e ?只 人 一 0,1,2,…,N 一 1 (12-48) 


w=0 


式 (12-48) 中 ,虽然 只 取 了 频率 域 的 M 个 值 ,时 域 边界 s(k) 的 NN 个 值 却 可 以 全 部 求 出 ， 
但 o 的 范围 缩小 了 , 即 为 重建 边界 点 所 用 的 频率 项 少 了 。 由 于 传 里 叶 变换 的 高 频 分 量 对 应 
物体 的 细节 ,而 低频 分 量 对 应 物体 的 基本 轮廓 。 因 此 ,采用 适当 数量 的 低频 分 量 傅 里 叶 系数 
就 可 以 近似 描绘 出 物体 边界 的 近似 形状 。 

在 实际 应 用 中 还 要 考虑 到 如 下 一 些 问 题 : 

(1) 如 果 采 样 不 均匀 将 会 给 问题 求解 带 来 困难 ,因此 ,在 理论 上 应 采用 等 间隔 
取样 。 

(2) FFT 的 算法 要 求 序列 长 度 为 2 的 整数 次 方 ,这 样 在 采用 FFT 之 前 ,应 调整 序列 
s(k) 的 长 度 。 如 可 先 计算 出 轮廓 的 周 长 , 则 除 以 2 的 整数 次 方 得 出 采样 间隔 ,然后 一 个 点 、 
一 个 点 进行 追踪 。 

例 12-1: 傅 里 叶 描 述 子 实验 

由 于 傅 里 叶 变 换 及 其 傅 里 叶 描 述 子 具有 清晰 的 物理 意义 ,本 例 应 用 傅 里 叶 描 述 子 对 人 
类 染色 体 图 像 进行 傅 里 叶 描述 。 图 12-11(a) 为 原始 图 像 ,图 12-11(b) 一 图 12-11(i) 是 采 
不 同 数量 的 傅 里 叶 系 数 对 染色 体 图 像 进行 描述 的 实验 结果 。 本 实验 表明 , 仅 用 16 个 描述 
子 , 染 色 体外 轮廓 也 较 准 确 , 当 降 至 8 个 描述 子 时 ,对 染色 体外 轮廓 形状 的 描述 发 生 了 变化 ， 
出 现 了 较 大 的 误差 。 


12.4.2 拓扑 描述 


拓扑 学 (topology) 是 研究 图 形 性 质 的 理论 。 图 形 的 拓扑 性 质 具有 稳定 性 , 即 只 要 图 形 
没有 发 生 破 坏 性 变形 , 则 其 拓扑 性 质 不 会 因为 物理 变形 而 改变 。 因 此 ,区 域 的 拓扑 性 质 可 
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(a) 人 类 染色 体 图 像 (b) 阔 值 处 理 图 像 (c) 边界 提取 图 像 


(d) 256 个 描述 子 恢复 (e) 128 个 描述 子 恢复 


(g) 32 个 描述 


于 对 区 域 的 全 局 描述 
图 12-12(a) 所 示 ,如 果 


折 释 ,这 个 性 质 不 受 区 域 的 伸 长 .旋转 等 方面 的 影响 ,孔洞 数 太 就 不 会 发 4 


x 域内 的 连接 部 分 
大 子 集 ,在 这 个 子 集 的 
示 图 形 有 三 个 连接 部 分 
欧 拉 数 也 是 区 域 的 


图 12-13(a) 所 示 图 


了 恢复 (h) 16 个 描述 子 恢复 (iD 8 个 描述 子 恢复 


图 12-11 傅 里 叶 描述 子 实验 结果 


这 些 性 质 既 不 依赖 于 距离 ,也 不 依赖 于 距离 测度 的 其 他 特性 等 。 如 


各 区 域 中 的 孔洞 数 互 作为 拓扑 描述 子 ， ,只 要 区 域 没 有 被 撕 裂 或 
变化 

C 的 个 数 是 区 域 的 另 一 拓扑 特性 。 一 个 集合 的 连通 部 分 就 是 它 的 最 
点 都 可 以 用 一 条 完全 属于 该 子 集中 的 曲线 相连 接 。 图 12-12(b) 所 


拓扑 特性 之 一 , 欧 拉 数 (Euler-number)E 定义 为 
E=C—H (12-49) 
像 具有 1 个 连接 部 分 和 1 个 孔 , 所 以 其 欧 拉 数 已 为 0, 而 图 12-13(b) 


中 ,图 像 具 有 1 个 连接 部 分 和 2 个 孔 , 因 而 其 欧 拉 数 为 一 1 
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< 人 (人 


(a) 图 像 中 的 孔洞 (b) 有 三 个 连接 部 分 的 区 域 
图 12-12 拓扑 描述 示意 图 


(a) (b) 
图 12-13 欧 拉 数 的 计算 图 形 


12.4.3 边界 链 码 


链 码 是 对 区 域 边界 点 的 一 种 编码 表示 方法 。 该 方法 主要 是 利用 一 系列 具有 特定 长 度 和 
方向 的 相连 的 直线 段 来 表示 目标 的 边界 。 由 于 每 个 线段 的 长 度 固定 而 方向 数目 有 限 , 因 此 ， 
仅仅 有 边界 的 起 点 需要 采用 绝对 坐标 表示 ,其余 点 都 可 只 用 接续 方向 来 代表 偏 移 量 ,而且 对 
于 每 一 个 点 只 需 一 个 方向 数 就 可 以 代替 两 个 坐标 值 , 显 而 易 见 的 是 表示 一 个 方向 数 比 表示 
一 个 坐标 值 所 需 的 比特 数 要 少 ,因此 采用 链 码 表示 可 大 大 减少 边界 表示 所 需 的 数据 量 。 

数字 图 像 一 般 是 按 固定 间距 的 网 格 进行 采样 的 ,因此 最 简单 的 链 码 是 跟踪 边界 并 赋 给 
每 两 个 相 邻 像素 的 连 线 一 个 方向 值 。 常 用 的 有 4 方向 和 8 方向 链 码 ,如 图 12-14(a)、(b) 所 
示 ,其 方向 定义 都 为 有 限 数量 方向 ,而 且 直线 段 的 长 度 是 固定 的 。 


(a) 4 方向 链 码 (b) 8 方向 链 码 
图 12-14 边界 链 码 方向 与 码 值 


如 图 12-15 所 示 的 边界 ,车 设 起 始点 为 S, 则 可 分 别 用 4 方向 和 8 方向 链 码 表示 该 区 域 
的 边界 ( 道 时 钟 方向 ) 。 

若 采用 4 方向 , 则 链 码 为 1 1 1 1 1 2 2 
若 采用 8 方向 , 则 链 码 为 2 2 2 2 2 4 4 4 
应 用 中 直接 对 分 割 所 得 的 目标 边界 进行 编码 可 能 会 


PO 
4 区 丸和 人 在 
出 现 两 个 问题 : 一 是 码 串 比较 长 ; 


3 3 
6 6 
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二 是 噪声 及 其 他 干扰 可 能 导致 边界 小 的 变化 ,从 而 使 链 码 发 生 与 
目标 区 域 形状 无 关 的 较 大 变动 。 常 用 的 改进 方法 是 对 原 边 界 以 较 
大 的 网 格 重新 采样 ,并 将 与 原 边界 点 最 接近 的 大 网 格 点 确定 为 新 
的 边界 点 。 这 种 方法 也 可 用 于 消除 目标 尺度 变化 对 链 码 的 影响 。 

使 用 链 码 时 ,起 点 的 选择 是 很 关键 的 。 对 同一 个 边界 ,如 以 不 
同 的 边界 点 作为 链 码 的 起 点 ,得 到 的 链 码 则 是 不 同 的 。 为 解决 这 
个 问题 可 采用 归 一 化 链 码 表示 方法 ,具体 方法 如 下 : 

(1) 给 定 一 个 从 任意 点 开始 产生 的 链 码 , 先 将 它 视 为 一 个 由 
各 方向 数组 成 的 自然 数 。 

(2) 将 这 些 方向 数 依 一 个 方向 循环 ,以 使 它们 所 构成 的 自然 数 的 值 最 小 。 

(3) 将 这 样 转换 后 所 对 应 的 链 码 起 点 作为 该 区 域 边界 的 归 一 化 链 码 的 起 点 。 


12.4.4 一 阶 差分 链 码 


采用 链 码 表示 物体 或 区 域 边界 的 主要 优点 是 当 目 标 平移 时 ,边界 链 码 不 会 发 生变 化 ,而 
不 足 之 处 是 , 当 区 域 旋转 时 则 链 码 会 发 生变 化 。 为 解决 旋转 时 链 码 变化 的 问题 ,可 以 采用 链 
码 旋转 归 一 化 处 理 方法 , 即 应 用 原始 链 码 的 一 阶 差 分 来 重新 构造 一 个 表示 原 链 码 各 段 之 间 
方向 变化 的 新 序列 。 差 分 可 用 相 邻 两 个 方向 数 按 反 方向 相 减 ,所 谓 反 方向 即 后 一 个 减 去 前 
一 个 求 取 差分 。 如 图 12-16(a) 为 原始 图 像 的 区 域 及 方向 数 ; 图 12-16(b) 为 原始 图 像 的 链 码 
及 差分 ,其 中 上 面 一 行为 原 链 码 , 括 号 中 的 方向 数 为 将 最 右 一 个 方向 数 循环 到 左边 ,下 面 一 
行为 上 面 一 行 的 方向 数 两 两 相 减 得 到 的 差分 链 码 。 


5 
图 12-15 边界 链 码 编码 


(a) (b) 
图 12-16 原始 图 像 边 界 链 码 及 差分 


将 图 12-16(a) 逆 时 针 旋 转 90" 得 图 12-17, 图 12-17 (a)、(b) 分 别 为 旋转 以 后 图 像 的 链 码 
及 差分 。 和 图 12-16(b) 一 样 ,上 面 一 行为 4 方向 链 码 , 括 号 中 的 方向 数 为 将 最 右 一 个 方向 
数 循环 到 左边 ,下 面 一 行为 上 面 一 行 的 方向 数 两 两 相 减 得 到 的 差分 链 码 ,虽然 原 链 码 发 生 了 
变化 ,但 归 一 化 的 差分 码 并 没有 变化 。 
0 0 


2 
(a) (b) 
图 12-17 旋转 图 像 边 界 链 码 及 差分 
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12.4.5 霍 夫 变换 

霍 夫 (Hough) 变换 是 Hough 于 1962 年 提出 的 一 种 线 描述 方法 , 它 通过 笛 卡 儿 坐 标 和 
极 坐标 两 个 坐标 系 之 间 的 变换 来 检测 平面 内 的 直线 和 有 规律 的 曲线 。 霍 夫 变 换 具 有 在 变换 
空间 所 希望 的 边缘 积聚 而 形成 峰值 点 的 现象 。 

霍 夫 变换 可 以 将 笛 卡 儿 坐 标 空间 的 线 变换 为 极 坐标 空间 中 的 点 。 如 图 12-18 所 示 ,在 


可 用 如 下 参数 方程 来 表示 该 直线 。 
P= zcos0+t ysing (12-50) 


y p 


了 >- 


(a) (b) 
图 12-18 和 霍 夫 变换 示意 图 


这 就 是 直线 的 霍 夫 变换 。 通 过 霍 夫 变换 将 直角 坐标 系 中 的 直线 变换 到 极 坐 标 系 中 则 是 
一 个 点 。 而 在 x-y 坐标 系 中 的 共 点 直线 入 ,映射 到 (p,0) 坐 标 系 中 就 是 一 个 点 集 。 在 z-y 坐 
标 系 中 ,同一 直线 上 的 点 映射 到 极 坐 标 系 就 成 为 通过 同一 点 的 曲线 位。 因此 , 霍 夫 变换 使 两 
个 不 同 坐标 系 中 的 线 和 点 建立 了 一 种 对 应 关系 。 

根据 直角 坐标 系 和 极 坐标 系 变换 域 之 间 的 关系 ,总 结 霍 夫 变 换 具 有 如 下 主要 性 质 ， 

(1) 直角 坐标 系 中 的 一 点 对 应 于 极 坐 标 系 中 的 一 条 正弦 曲线 。 

(2) 变换 域 极 坐标 系 中 的 一 点 对 应 于 直角 坐标 系 中 的 一 条 直线 。 

(3) 直角 坐标 系 一 条 直线 上 的 N 个 点 对 应 于 极 坐标 系 中 共 点 的 N 条 曲线 。 这 条 性 质 
可 证 明 如 下 。 

证 明 : 设 z-y 平面 中 在 同一 直线 上 的 N 个 点 分 别 为 (zy ) (zy)、、(CzwsyN)，, 因 
此 ,可 得 


和 一 azi 十 0 一 1,2,3，N (12-51) 
根据 霍 夫 变 换 可 知 ,对 于 上 述 N 点 ,其 变换 域 的 曲线 方程 为 
ai = ricosg 十 yising i=1,2,3,%N (12-52) 


代入 直线 方程 可 得 
ai 一 zicosb 十 yisin0， i= 1,2,3,…,N 
= Zicosbi 十 (azri + b)sinO; 
= Xi(cos0; 十 asin0) + bsinO; (12-53) 
由 于 zi(i 二 1,2,3,…,N) 可 取 直 线 上 NN 个 点 中 的 任意 一 个 ,而 且 N 本 身 可 以 取 任 意 


值 ,因此 , 极 坐 标 系 中 的 曲线 定 通过 p osin[ aretan (十)]: 人 = aretan [十] 这 点 。 
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(4) 在 极 坐标 系 中 ,同一 条 曲线 上 的 N 个 点 对 应 于 直角 坐标 系 中 通过 同一 点 的 N 条 直 
线 。 这 条 性 质 可 证 明 如 下 。 
证 明 : 设 极 坐标 系 中 有 N 个 点 ,分 别 为 
(p1101) p2102) + (pn sOn) 
由 于 NN 个 点 在 同一 曲线 上 ,于 是 有 


ai 一 acosb 十 bsin0 i=1,2,3,.°,N (12-54) 
又 因为 
Pp: = ZXicos0: 十 isinl 
对 于 直角 坐标 系 有 
二 
六 一 一 Ticotl 十 a 


Xxicot0; 十 EE (acos0: + bsinO; ) 
sinO; 


inl 
一 (一己 十 a)cot0 十 0 (12-55) 
因此 ,不 论 4 取 值 于 极 坐标 系 中 的 哪 一 个 点 ,直线 都 经 过 zi 一 avy 一 /这 一 点 。 

霍 夫 变换 的 应 用 可 用 如 下 方法 实现 : 

在 直角 坐标 中 的 每 一 离散 数据 点 变换 为 极 坐标 系 中 的 曲线 。 将 p 和 0 分 成 许多 小 段 ， 
即将 (p,0) 分 成 许多 小 单元 ,每 一 个 小 单元 可 设 一 累加 嚣 。 在 直角 坐标 系 中 可 能 落 在 直线 上 
的 每 一 点 对 应 极 坐标 系 中 的 一 条 曲线 p; 二 zxicos0; 十 yisin0;。 分 别 使 0 等 于 0,A0,2A0,…, 便 
可 求 出 相应 的 p 值 ,并 分 别 计算 落 在 各 小 单元 中 的 次 数 , 当 全 部 直角 坐标 点 (xi,yi) 完 成 变 
换 后 ,可 对 小 单元 的 累加 器 进行 检测 ,峰值 的 小 单元 对 应 于 极 坐 标 曲 线 上 的 共 线 点 ,而 这 些 
曲线 对 应 的 直角 坐标 上 的 点 可 以 认为 是 共 线 的 。 检 测 出 直角 坐标 上 的 N 点 之 后 ,将 曲线 交 
点 坐标 (oo ,0 ) 代 入 m 王 zcosm 十 ysinb ,就 可 以 得 到 逼近 N 点 的 直线 方程 。 

霍 夫 变换 的 优点 是 抗 干扰 能 力 强 , 当 检测 线 上 有 小 的 扰动 . 断 开 或 虚线 时 ,经 霍 夫 变换 
之 后 ,在 变换 空间 依然 可 以 得 到 明显 的 峰值 点 。 


12.5 纹理 描述 


图 像 纹 理 是 图 像 的 重要 特征 ,也 是 大 家 所 熟悉 的 概念 。 什 么 是 纹理 ,目前 还 没有 统一 、 
公认 的 确切 定义 。 一 般 认为 类 似 于 布 纹 、 草 地、 砖头 、 墙 面 等 具有 重复 性 结构 的 图 像 称 为 纹 
理 图 像 。 纹 理 图 像 在 局 部 区 域内 可 能 呈现 不 规则 性 ,但 整体 上 则 表现 出 一 定 的 规律 性 ,其 灰 
度 分 布 往往 表现 出 某 种 周期 性 。 纹 理 图 像 所 表现 出 的 这 种 特有 的 性 质 称 为 纹理 。 实 际 中 很 
多 图 像 具 有 纹理 型 结构 ,对 这 类 纹理 型 图 像 可 以 通过 纹理 分 析 提 取 其 宏观 特征 信息 。 


12.5.1 纹理 特征 


纹理 (texture) 一 词 最 初 指 纤 维 物 的 外 观 ,纹理 图 像 在 很 大 范围 内 没有 重大 细节 变化 ， 
在 这 些 区 域内 图 像 往往 显示 出 重复 性 结构 。 有 时 ,物体 在 纹理 上 与 其 周围 背景 和 其 他 物体 
有 区 别 , 这 时 ,图 像 分 割 应 以 纹理 为 基础 。 虽然 纹理 目前 尚 无 统一 的 定义 ,但 一 般 来 说 ,纹理 
是 由 许多 相互 接近 的 、 互 相交 织 的 元 素 构 成 .它们 具有 周期 性 。 纹 理 在 一 定 程度 上 反映 了 一 


出 
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个 区 域 中 像素 灰 度 级 的 空间 分 布 的 属性 。 

纹理 可 分 为 人 工 纹理 和 天 然 纹 理 ( 自 然 纹理 )。 人 工 纹理 由 某 种 符号 的 有 序 排列 组 成 ， 
这 些 符 号 可 以 是 线条 \ 点 、. 字 母 、 数 字 等 。 自 然 纹理 是 具有 重复 排列 现象 的 自然 景象 ,如 砖 
墙 、 种 子 、 森 林 、 草 地 之 类 的 照片 。 图 12-19(a) 是 常见 的 人 工 纹理 结构 ,图 12-19(b) 是 常见 


(a) 典型 的 人 工 纹理 


(b) 典型 的 自然 纹理 
图 12-19 典型 的 纹理 结构 图 


归纳 起 来 ,对 纹理 的 认识 有 两 种 看 法 。 一 种 是 任 人 们 的 直观 印象 ,而 另 一 种 是 凭 图像 本 
身 的 结构 。 从 直观 印象 出 发 的 方法 包含 有 心理 学 因素 ,这 样 就 会 产生 多 种 不 同 的 统计 纹理 
特性 ,从 这 一 观点 出 发 ,纹理 分 析 应 该 采用 统计 方法 。 从 图 像 结 构 观 点 出 发 , 则 认为 纹理 是 
一 种 结构 ,根据 这 一 观点 ,纹理 分 析 应 该 采用 句法 结构 方法 。 

描述 图 像 特 性 的 参数 有 很 多 种 ,对 于 纹理 图 像 来 说 有 必要 知道 各 个 像素 及 其 邻近 像素 
的 灰 度 分 布 情况 。 了 解 邻近 像素 灰 度 值 变 化 情况 的 最 简单 方法 是 取 1 阶 微分 .2 阶 微分 的 
平均 值 与 方差 ,如 果 要 考虑 纹理 的 方向 性 特征 , 则 可 考察 0 方向 与 (9 十 r/2) 方 向 差分 的 平均 
值 与 方差 。 纹 理 分 析 常 用 的 方法 有 统计 法 、 自 相关 函数 法 、 傅 里 叶 频 谱 法 、 联 合 概率 矩阵 法 
和 句法 结构 法 等 。 


12.5.2 统计 法 


统计 法 是 指 利 用 图 像 内 某 一 区 域 或 物体 的 灰 度 直方 图 的 矩 对 纹理 结构 进行 描述 , 它 又 
可 以 分 为 灰 度 差分 统计 法 和 行程 长 度 统计 法 。 

1. 灰 度 差分 统计 法 

取 图 像 内 任意 一 点 (zx,y) , 设 与 该 点 相 邻 的 点 (z+ 十 Az,y 十 Ay) 的 灰 度 差 值 为 

ga(Czyy) 一 gzyy) 一 gz 十 Azyy 十 Ay) (12-56) 

ga(T,y) 称 为 灰 度 差分 。 若 ga (x,y) 的 所 有 可 能 取 值 共有 mr 级 , 令 点 (zx,y) 在 整个 区 
域 上 移动 ,统计 出 ga(z,y) 取 各 个 灰 度 级 的 次 数 , 由 此 作出 gsCz,y) 的 直方 图 。 根 据 直 方 图 
可 以 得 出 ga(z,y) 取 不 同 灰 度 值 的 概率 ps (i)。 

车 i 取 值 较 小 ,而 概率 ps (i) 较 大 时 , 则 说 明 纹 理 较 粗 烟 ; 若 概率 pa (i) 较 平坦 , 则 说 明 
纹理 较 细密 。 
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灰 度 差分 统计 法 一 般 采 用 以 下 参数 描述 纹理 图 像 的 特征 : 


1) 对 比 度 

CON = Di:pali) (12-57) 
2) 角度 方向 二 阶 矩 

ASM = >) [ps DI (12-58) 
3) 焙 

ENT =— Dpa(Dlgpa (i) (12-59) 
4) 平均 值 
Bipalid 
MEAN = 一 (12-60) 


m 
根据 上 述 公式 ,车 ps (让) 较 平 坦 , 则 ASM 较 小 ,而 ENT 较 大 ; 若 ps (让 分 布 在 原点 附 
近 , 则 MEAN 值 较 小 。 
2. 行程 长 度 统计 法 
设 图 像 内 任意 点 (z,y) 的 灰 度 值 为 g, 与 其 相 邻 点 的 灰 度 值 也 可 能 为 g 或 其 他 值 ,统计 
出 从 任 一 点 出 发 沿 0 方向 上 连续 个 点 都 具有 灰 度 值 g 所 发 生 的 概率 , 记 此 概率 为 P(g,n)。 
在 同一 方向 上 具有 相同 灰 度 值 的 像素 点 的 数量 称 为 行程 长 度 。 根 据 P(g,n) 可 以 定义 以 下 
参数 来 描述 纹理 特征 。 
1) 长 行程 加 重 法 
Dn:plgsn) 
LRE= (12-61 
Dplg.n) ) 
2) 灰 度 值 分 布 
2 [Dp em] 


GLD= 


Dplgsn) 


go 


(12-62) 


3) 行程 长 度 分 布 
2 [2p(8m] 
Dp gn) 


RLD = (12-63) 


Dp lgsn) 


RPG = Ny (12-64) 


式 中 ,N 为 图 像 的 像素 总 数 。 
12.5.3 频谱 法 


频谱 法 即 用 傅 里 叶 变 换 分 析 纹理 的 特征 ,依据 傅 里 叶 频 谱 的 频率 特性 来 描述 周期 的 或 
近似 周期 的 二 维 图 像 纹 理 结构 。 对 于 图 像 而 言 , 如 下 二 维 傅 里 叶 变换 
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二 | [fpr drdy (12-65) 
能 包括 其 全 部 纹理 信息 。 二 维 傅 里 叶 变换 的 功率 谱 为 
= (12-66) 


傅 里 叶 频谱 中 突起 的 峰值 对 应 纹理 模式 的 主 方向 ,峰值 在 频 域 平面 的 位 置 对 应 模式 的 
基本 周期 , 若 采 用 滤波 将 周期 性 成 分 滤 除 , 剩 下 的 非 周期 性 部 分 可 用 统计 方法 描述 。 
实际 应 用 中 ,一般 将 频谱 先 转换 到 极 坐 标 系 中 ,如 图 12-20 所 示 , 此 时 傅 里 叶 变 换 可 
F(r,0) 表 示 , 其 频谱 可 用 函数 S(r,0) 二 1F(r,0)1? 表示 。 
hy 


A, 


(a) (b) 
图 12-20 纹理 和 对 应 的 频谱 示意 图 
对 每 个 确定 的 方向 0,S(r,0) 是 一 个 一 维 函数 SCr); 对 每 个 确定 的 频率 7,S(r,0) 是 一 
个 一 维 函 数 S(0)。 对 给 定 的 0, 分析 SCr) 可 得 到 频谱 沿 原点 射出 方向 的 行为 特性 ; 对 给 定 
的 ,分析 S(0) 可 得 到 频谱 在 以 原点 为 中 心 的 圆 上 的 行为 特性 。 如 果 将 这 些 函 数 积分 可 得 
到 更 为 全 局 性 的 描述 , 即 
S(7) = Ir [FG(7,0)Jd0 (12-67) 


S(0) = > [FCr,O Fdr (12-68) 


如 果 是 离散 图 像 , 将 上 述 积分 分 别 以 求 和 代替 即 可 得 出 相应 的 公式 , 即 这些 函 数 序列 分 
别 对 0 或 求 和 同样 可 得 到 沿 某 一 角度 0 方向 和 半径 7 方向 的 全 局 性 的 描述 , 即 
S(7) = >) | FCG,0) | = >)SCr,0) (12-69) 


S(O) = >) | FCG.0 | = >)SCr,0) (12-70) 


S(r) 和 S(0) 构 成 整个 图 像 或 图 像 区 域 的 纹理 频谱 能 量 描 述 。 如 果 7 较 小 ,S(7) 很 大 ,r 
很 大 ,S(7) 却 较 小 , 则 说 明 是 粗糙 性 纹理 结构 ; 反之 ,如 果 7 变化 对 S(7) 的 影响 较 小 , 则 为 细 
密 的 纹理 结构 。 在 纹理 粗糙 的 情况 下 ,能量 多 集中 在 离 原点 很 近 的 范围 内 , 即 图 12-20(b) 
中 的 曲线 A ,而 在 纹理 较 细 的 情况 下 ,能 量 分 布 在 离 原点 较 远 的 范围 内 , 即 图 12-20(b) 中 的 
曲线 B。 
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12.5.4 空间 自 相 关 函 数 法 


物体 的 纹理 常用 其 粗糙 性 加 以 描述 。 例 如 ,在 相同 的 外 观 条 件 下 , 毛 织品 一 般 比 丝织品 
粗糙 。 粗 糙 性 的 程度 与 局 部 结构 的 空间 重复 周期 有 关 , 周 期 大 的 纹理 细 ; 反之 则 纹理 粗糙 。 
这 种 感觉 上 的 粗糙 虽 不 足以 定量 表示 纹理 的 测度 ,但 可 说 明 纹 理 测度 的 变化 趋势 。 即 纹理 
测度 值 小 表示 纹理 比较 细密 ,纹理 测度 值 大 表示 纹理 比较 粗糙 。 

设 图 像 以 /(m,n) 表 示 , 则 自 相 关 函 数 可 定义 为 


iw ktw 


泥 ZF ms mf(m—en—y) 


Clesmhisk) = Pe (12-71) 


了 SS [Lf Om,n)] 


式 (12-71) 是 对 (2w 十 1) X (2um 十 1) 窗 口内 的 每 一 个 像素 点 (7 有 与 偏离 值 为 s,7 一 0， 
士 1, 士 2,…, 士 T 的 像素 之 间 的 相关 值 进行 计算 。 一 般 纹 理 区 对 给 定 偏离 (s,7) 时 的 相关 性 
要 比 细 纹 理 区 高 ,因而 纹理 粗糙 性 与 自 相关 函数 的 扩展 成 正比 。 自 相关 函数 扩展 的 一 种 测 
度 就 是 二 阶 矩 ,定义 为 


和 k 
TO = 2) De Ce jk) (12-72) 
=—T y=—T 


纹理 越 粗 烟 , 则 TC,k) 越 大 ,因此 可 以 方便 地 用 TG ,) 作 为 度量 纹理 粗糙 程度 的 参数 
之 一 。 


12.5.5 有 灰 度 共生 和 矩阵 法 


灰 度 共生 和 矩阵 法 又 称 为 联合 概率 矩阵 法 ,是 通过 对 图 像 的 所 有 像素 进行 统计 并 描述 其 
灰 度 分 布 的 一 种 方法 。 取 图 像 中 任意 一 点 (zx,y) 及 偏离 它 的 男 一 点 (x 十 a,y 十 b) 组 成 一 个 
点 对 , 设 该 点 对 的 灰 度 值 为 (8 ,8? )。 令 点 (zyy) 在 所 分 析 的 区 域内 移动 , 则 可 得 到 全 部 
(gi,82) 值 。 若 灰 度 值 的 级 数 为 &, 则 (gi ,gz) 共 有 k 种 组 合 。 对 于 整个 区 域 ,统计 出 每 一 个 
(gisg2) 值 出 现 的 次 数 ,然后 排列 成 一 个 方 阵 ,再 用 (gi ,g;) 出 现 的 总 次 数 将 之 归 一 化 为 出 现 
的 概率 p(g1 ,gs) ,这 样 的 方 阵 称 为 联合 概率 矩阵 ,又 称 为 灰 度 共生 和 矩阵 或 灰 度 共 现 矩 阵 。 

图 12-21 为 一 个 简单 的 例子 。 图 12-21(a) 为 原始 图 像 ,共有 16 个 灰 度 级 ,为 使 概率 矩 
阵 简 单 起 见 , 首 先 将 图 12-21(a) 的 灰 度 级 数 减 为 4 级 变 为 图 12-21(b) 的 形式 。(g1 ,gz) 分 
别 取 值 为 0.1、2、3。 因 此 将 (gi ,gs) 各 种 组 合 出 现 的 次 数 排列 起 来 ,可 以 得 到 图 12-21(c) 一 (e) 
所 示 的 联合 概率 矩阵 。 以 图 12-21(c) 中 的 频数 10 为 例 , 该 数据 表示 图 12-21(b) 中 灰 度 值 
为 (0,1) 共 出 现 10 次 ,其 余 可 依 此 类 推 。 

由 此 可 见 , 差 分 值 Ca,2) 取 不 同 的 数值 ,就 可 以 得 到 不 同情 况 下 的 联合 概率 矩阵。(a,0) 
取 值 要 根据 纹理 周期 分 布 的 特性 进行 选择 ,对 于 较 细 的 纹理 ,选取 (1,0)、(1,1)、(2,0) 等 较 
小 的 差分 值 , 即 a、b 取 值 较 小 时 ,对 应 于 变化 缓慢 的 纹理 结构 ,其 联合 概率 矩阵 对 角 线 上 的 
数值 较 大 。 若 纹理 的 变化 越 快 , 则 对 角 线 上 的 数值 就 越 小 ,对 角 线 两 侧 的 元 素 值 却 增 大 。 为 
了 能 描述 纹理 的 综合 状况 ,应 根据 联合 概率 矩阵 的 特点 计算 纹理 的 相关 特征 参数 ,典型 的 参 
数 有 如 下 几 种 。 
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六 6 10 14 6 10 0 1 艺 3 0 1 
6 10 14 2 6 10 14 人 2 EE 0 1 2 入 
10 14 2 6 10 14 2 车 六 和 流风 
14 2 6 10 14 6 0 
2 6 10 14 6 10 0 1 2 30 1 32 
6 10 14 入 6 10 14 1 2 3 0 1 2 
10 14 2 6 10 14 路 2 3 0 1 2 3 0 
加 ) (b) 
Co[0 10 0 ovofs 0 0 ol sofo 0 9 0 
1lo on ol 1lo 。0 0 1lo o 0 mn 
2l0 oo 2l0o 0o10 0 2l90 0 0 0 
3|110 0 0 0 玉 | 诊 0 0 9 3|0 8 0 0 
= 一 ah = 小 
(qa=1, b=0) (oa=1,b=1) (ao=1, b=2) 
(9) (qd) (e) 
图 12-21 灰 度 共生 和 矩阵 计算 方法 
1) 角 二 阶 距 
角 二 阶 (ASM) 距 是 图 像 灰 度 均 匀 性 的 一 种 度量 ,定义 为 
Q = 2 2) [pg sg) (12-73) 


Bl Bg 


角 二 阶 距 是 灰 度 共生 和 矩阵 元 素 值 的 平方 和 ,因此 又 称 为 能 量 , 它 是 纹理 图 像 灰 度 分 布 均 
一 性 的 度量 ,也 被 视 为 图 像 纹 理 粗细 的 度量 指标 。 

如 果 共 生 和 矩阵 的 所 有 元 素 值 均 相等 , 则 ASM 值 较 小 ; 反之 ,如 果 和 矩阵 元 素 的 一 部 分 元 
素 值 大 而 其 他 值 小 , 即 共生 和 矩阵 中 元 素 集中 分 布 时 , 则 ASM 值 大 。 

2) 惯性 矩 

惯性 矩 又 称 为 对 比 度 CCON) ,可 以 理解 为 图 像 的 清晰 度 ,在 图 像 中 纹理 的 纹 沟 越 深 ,对 
比 度 则 越 大 ,图 像 的 视觉 效果 越 清晰 。 


Q, = > kz[>)， Dplg,g2)] (12-74) 
和 gl 82 
式 中 
k=g1— gz (12-75) 


对 比 度 是 图 像 中 局 部 灰 度 变化 大 小 的 度量 ,对 比 度 大 小 反映 了 图 像 的 清晰 度 、 纹 理 密度 
和 沟 纹 深浅 程度 。 图 像 的 纹理 沟 纹 越 深 , 其 对 比 度 越 大 ,视觉 效果 越 清晰 ; 反之 , 若 对 比 度 
小 , 则 沟 纹 浅 ,效果 模糊 。 灰 度 差 即 对 比 度 大 的 像素 对 越 多 ,这 个 值 越 大 。 灰 度 共 生 和 矩阵 中 
远离 对 角 线 的 元 素 值 越 大 , 则 对 比 度 越 大 。 

3) 相关 性 

相关 性 (COR) 用 于 衡量 灰 度 共生 和 矩阵 的 元 素 在 行 或 列 方向 上 的 相似 程度 。 


2) Pagsp gs 8) — psps 


Bl B82 


Q; 


(12-76) 


Oz0y 
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式 趾 
kz 一 局 训 2 pa ‘82) 
和 (C12 -97 
Ai 一 D8: 2 pa "82) 
可 a 
= 3 (gi1 一 ja)2 2) Dplg,g2) 
二 地 和 (12-78) 


% = 2 (gi—p) 2 2 pag82) 


Bl Bg 


相关 性 是 纹理 图 像 局 部 灰 度 线性 相关 的 度量 ,体现 在 纹理 上 就 是 表示 图 像 中 纹理 区 域 
在 某 种 方向 上 的 相似 性 。 它 用 于 度量 空间 灰 度 共生 和 矩阵 元 素 在 行 或 列 方向 上 的 相似 度 , 因 
此 ,相关 性 的 大 小 反映 了 图 像 中 局 部 灰 度 相关 性 。 当 元 素 均 匀 一 致 或 相等 时 ,相关 值 就 大 ; 
反之 , 若 和 矩阵 元 素 值 相差 较 大 , 则 相关 性 小 。 图 像 内 存在 水 平方 向 纹理 时 , 则 水 平方 向 矩阵 
的 Qs 值 大 于 其 余 矩 阵 的 Q; 。 

) 灶 

炉 (ENT) 是 图 像 具 有 的 信息 量 的 一 种 度量 ,纹理 信息 也 是 图 像 的 信息 ,车 一 幅 数 字 图 
像 没 有 纹理 , 则 灰 度 共生 矩阵 接近 为 零 矩 阵 。 

Q, =— 2) 2 p(g1,82)lgp(g1 ,82) (12-79) 


gl ge 


灶 表 征 了 图 像 中 纹理 的 复杂 程度 ,反映 了 图 像 纹理 灰 度 分 布 的 随机 性 ,是 图 像 所 具有 的 
信息 量 的 度量 。 纹 理 信息 也 属于 图 像 的 特征 信息 , 当 共 生 和 矩阵 中 所 有 元 素 有 最 大 的 随机 性 、 
空间 共生 矩阵 中 所 有 值 几 乎 相等 时 ,共生 和 矩阵 中 元 素 分 散 分 布 时 , 较 大 。 它 表示 了 图 像 中 
纹理 的 非 均匀 程度 或 复杂 程度 。 

5) 逆差 矩 

道 差 矩 (IDM) 的 定义 为 

Q; =— 2 Dplgisg)[1+ gi — g2)] (12-80) 


逆差 矩 反映 了 图 像 纹 理 的 同 质 性 , 它 可 用 于 度量 图 像 纹 理 的 局 部 变化 情况 。 逆 差 矩 大 
则 说 明 图 像 纹理 的 不 同 区 域 间 缺少 变化 ,局 部 非常 均匀 。 

需 指 出 的 是 有些 情况 下 ,Q、Q;、Q;、Q、Q; 单一 指标 所 指示 的 图 像 特征 并 不 是 很 直 
观 , 有 时 需要 根据 多 个 指标 评价 图 像 的 纹理 信息 。 根 据 目 前 对 纹理 的 研究 ,Q 一 Qs 是 描述 
纹理 特征 非常 有 效 的 参数 。 

例 12-2: 纹理 特征 参数 计算 

图 12-22 为 4 位 不 同 个 体 的 4 幅面 部 脸颊 皮肤 图 像 , 分 别 对 上 述 图 像 采 用 基于 灰 度 共 
生 和 矩阵 方法 计算 其 纹理 特征 参数 ,包括 角 二 阶 矩 、 炉 、 对 比 度 、 相 关 , 各 所 列 特 征 值 均 为 0”、 
45"、90”、135” 4 个 方向 上 的 平均 值 ,其 标准 差 指 特征 值 在 上 述 4 方 向 上 的 标准 差 。 相 应 的 实 
验 数据 如 表 12-1 所 示 。 


出 
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(a) 1801c.bmp (b) 1802c.bmp (c) 2811c.bmp (d) 2812c.bmp 


图 12-22 面部 图 像 纹理 图 像 


表 12-1 纹理 特征 参数 计算 结果 


图 像 名 | 角 二 阶 矩 | 标准 差 炉 标准 关 | 对 比 度 | 标准 差 ‖ 相关 性 | 标准 差 
180lc | 0.29882 | 0.01121 | 1.62286 | 0.18031 | 0.23411 | 0.01026 | 1.67884 | 0.12071 
1802c | 0.263 05 | 0.01153 | 1.755 31 | 0.16159 | 0.27914 || 0.02101 | 1.43109 | 0.125 61 
2811c | 0.33259 | 0.01426 | 1.53991 | 0.13461 | 0.27054 | 0.01491 | 1.68611 | 0.112 89 
2812c | 0.29009 | 0.01391 | 1.634 69 | 0.15978 | 0.22359 | 0.06125 | 1.59618 | 0.15178 


根据 表 12-1 的 实验 数据 ,对 于 皮肤 


图 像 , 其 角 二 阶 和 矩 (ASM) 大 表明 图 像 相 对 均一 、 规 


则 变化 的 纹理 模式 , 即 图 像 的 纹理 结构 较 均 匀 一 致 。 炉 CENT) 越 大 说 明 图 像 的 信息 越 大 ， 
即 图 像 纹 理 变化 较 多 ; 反之 , 则 图 像 纹 理 变 化 较 少 。 对 比 度 (CON) 大 表明 图 像 纹理 结构 差 
异性 较 大 。 相 关 性 (COR) 的 大 小 表明 皮肤 图 像 中 局 部 像 元 灰 度 值 的 相关 性 , 即 在 行 或 列 方 
向 GLCM 各 元 素 的 相似 程度 ,COR 大 说 明 皮 肤 图 像 的 纹理 相关 性 较 好 ,纹理 视觉 效果 较 
好 。 在 进行 大 量 皮肤 纹理 比较 时 , 若 皮肤 图 像 的 平均 特征 值 相 同 ,标准 差 小 说 明 该 特征 值 在 
4 个 方向 上 一 致 性 更 好 。 

本 实验 表明 ,纹理 特征 参数 不 仅 能 评价 一 幅 图 像 纹理 的 信息 ,而 且 4 个 特征 参数 还 具有 
相关 性 。 若 皮肤 图 像 的 烂 值 大 , 则 对 比 度 大 , 角 二 阶 和 矩 和 相关 性 则 小 。 

皮肤 纹理 特征 参数 实验 程序 代码 如 下 : 

[name, path] = uigetfile('D:\cth01\ 人 脸 纹理 \ * .bmp', ' 打 开 皮 肤 图 像 文件 '); 

name = strcat(path, name); 

% fid= fopen(name); 

Gray = imread(name); 

[M,N,0] = size(Gray); 


M= 


256; 


N = 256; 
fori= 1:M 
forj = 1:N 
forn = 1:256/16 
if (n—1)*16<=Gray(i,j)gGray(i,j)<= (n—1)*16+15 
Gray(i,j) = n-1; 


end 
end 


end 


end 


s#3. 计 算 四 个 方向 灰 度 共生 矩阵 ,角度 分 别 为 0 ,45 `,90" ,135 方向 
P = zeros(16,16,4); 
form = 1:16 
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forn = 1:16 
for = 1:M 
forj = 1:N 
if j<NS&Gray(iy,j) ==m- 1g&Gray(i,j+1)==n-1 
P(m,n,1) = P(m,n,1)+1; 
P(n,m,1) = P(m,n,1); 
end 
if i> 18j<N&Gray(i,j) ==m- 1&Gray(i—1,j+1)==n-1 
P(m,n,2) = P(m,n,2)+1; 
P(n,m,2) = P(m,n,2); 
end 
if i<MgGray(i,j) ==m- 1g&Gray(i+1,j)==n-—1 
P(m,n,3) = P(m,n,3)+1; 
P(n,m,3) = P(m,n,3); 
end 
if i<M&j < NgGray(i,j) ==m- 18Gray(i+1,j+1)==n-—1 
P(m,n,4) = P(m,n,4)+1; 
P(n,m,4) = P(m,n,4); 
end 
end 
end 
if m==n 
P(m,n,:) = P(m,n,:)*2; 
end 
end 
end 
*#% 共 生 和 矩阵 归 一 化 
forn = 1:€ 
P(:,:,n) = P(:,:,n)/sun(sum(P(:, :,n))); 
end 
H= zeros(1,4); 
I=H; 
Ux = H; Uy = H; 
deltax= H; deltaY = H; 
C=H; 
forn = 1:4 
E(n) = sum(sum(P(:,:,n).^2)); 名 能 量 
fori = 1:16 
for j = 1:16 
if P(i,j,n)~=0 
H(n) = -P(i,j,n) *1log(P(i,j,n))+H(n); % 入 
end 
I(n) = (i-j)^*2*P(i,j,n) +I(n); 惯性 矩 
Ux(n) = ixP(i,j,n) + Ux(n); 相关 性 中 px 
Uy(n) = jxP(i,j,n) +Uy(n); 名 相关 性 中 py 
end 
end 
end 
forn = 1:4 
fori = 1:16 


forj = 1:16 


出 
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deltax(n) (i—Ux(n))*2*P(i,j,n) +deltax(n); 
deltaY(n) (j-Uy(n))^2*Pl(i,j,n) +deltaY(n); 
C(n) = ixjx*P(i,j,n)+C(n); 

end 


end 
C(n) = (C(n) - Ux(n) * Uy(n))/deltax(n)/deltaY(n); 相关 性 


end 

能 量 、 粹 .惯性 算 .相关 均值 和 标准 差 
al = mean(E); 

bl = sqrt(cov(E)); 

a2 = mean(H) ; 

b2 = sqrt(cov(H)); 

a3 = mean(I); 

b3 = sqrt(cov(I)); 

a4 = mean(C); 

b4 = sqrt(cov(C)); 


1 
在 纹 
进行 纹理 


5.6 纹理 句法 结构 分 析 


理 的 句法 结构 分 析 中 ,将 纹理 定义 为 结构 基 元 按 某 种 规则 重复 分 布 所 构成 的 模式 。 
结构 分 析 , 需 要 先 描述 结构 基 元 的 分 布 规 律 。 因 此 ,一 般 可 进行 如 下 两 项 工作 : 


(1) 从 输入 图 像 中 提取 结构 基 元 并 描述 其 特征 。 
(2) 描述 结构 基 元 的 分 布 规则 。 具 体 方法 如 下 : 首先 将 纹理 图 像 分 成 许多 窗口 , 即 形 


成 子 纹理 
可 以 是 4 


。 其 中 最 小 的 小 块 就 是 最 基本 的 子 纹理 ( 即 基 元 )。 纹 理 基 元 可 以 是 一 个 像素 ,也 
个 或 9 个 灰 度 比较 一 致 的 像素 集合 。 纹 理 的 表达 可 以 是 多 层次 的 ,如 图 12-23(a) 


所 示 , 它 可 以 从 像素 或 小 块 纹理 一 层 一 层 地 向 上 拼合 。 而 且 , 基 元 的 排列 可 有 不 同 规则 ,如 


图 12-23( 
子 纹理 ,于 


b) 中 ,第 一 级 纹理 排列 为 ABA, 第 二 级 纹理 排列 为 BAB 等 ,其 中 A、B 代表 基 元 或 


描述 。 
纹理 


F 是 就 组 成 了 一 个 多 层 的 树 状 结构 ,可 用 树 状 文法 产生 一 定 的 纹理 ,并 以 句法 加 以 


的 树 状 安排 可 有 多 种 方法 。 如 图 12-23(c) 所 示 , 树 根 安排 在 中 间 , 树 枝 向 两 边 伸 
出 ,每 个 树枝 有 一 定 的 长 度 。 又 如 图 12-23(d) 中 , 树 根 安排 在 一 侧 , 分 枝 都 向 另 一 侧 伸展 。 
纹理 图 像 
| A|B|A 
子 图 像 : : [se | | i | 
: : 第 一 级 | B | A | B 
2 gn | | | 
(a) (b) 
0 0 10 0 
boll oo 
i 0 
| Wl | 1 一 1 一 1 一 1 一 1 
11111 be 
00100 0 一 0 一 1 一 0 一 0 
(©) (d) 
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纹理 判别 可 用 以 下 方法 : 首先 将 纹理 图 像 分 成 固定 尺 才 的 窗口 ,用 树 状 文法 说 明 属 于 
同 纹理 图 像 的 窗口 ,可 以 用 树 状 自动 机 识别 树 状 , 因 此 ,对 每 一 个 纹理 文法 可 建立 一 个 “结构 
保存 的 误差 修正 树 状 自动 机 ”。 该 自动 机 不 仅 可 以 接收 每 个 纹理 图 像 中 的 树 ,而 且 能 用 最 小 
忠 离 判 据 辨识 类 似 的 有 噪声 的 树 ; 然后 ,可 以 对 一 个 分 割 成 窗口 的 输入 图 像 进行 分 类 。 


12.6 骨架 提取 


图 像 骨 架 提取 是 指 提取 目标 在 图 像 中 的 中 心 像素 轮廓 , 即 以 物体 的 对 称 中 心 为 目标 ,对 
目标 进行 细 化 , 细 化 后 的 目标 通常 为 单 层 像素 宽度 。 图 像 细 化 和 骨架 提取 的 目的 都 是 为 了 
减 小 像素 的 连通 区 ,一般 情况 下 这 些 运算 是 不 可 道 的 。 通 俗 地 说 ,骨架 化 运算 是 指 将 目标 区 
域 变 为 条 形 骨 架 的 算法 。 由 于 从 一 幅 骨 架 状 图 形 常 可 以 识别 出 一 些 复杂 的 形状 (如 动物 、 飞 
机 等 ), 因 此 区 域 的 骨架 携带 了 物体 的 许多 形状 信息 , 它 对 描述 变 宽 度 的 长 条 形 物 体 且 不 需 
考虑 其 宽度 影响 的 二 值 图 像 十 分 有 效 。 


12.6.1 骨架 的 概念 


目前 ,图 像 的 骨架 还 没有 被 一 致 认可 的 定义 。 骨 架 或 细 化 的 概念 主要 是 针对 二 值 图 而 
言 的 。 某 种 意义 上 ,所 谓 骨 架 , 可 以 理解 为 图 像 的 中 轴 , 例 如 ,长 方形 的 骨架 ,主要 由 其 长 轴 
方向 的 中 轴线 组 成 , 圆 的 骨架 是 其 圆心 ,直线 的 骨架 是 它 自身 ,孤立 点 的 骨架 也 是 其 自身 。 

骨架 的 获取 主要 有 以 下 两 种 方法 。 

1. 烈火 燃烧 

设想 在 同一 时 刻 , 将 目标 物体 的 边缘 线 同时 点 燃 ,全 部 燃 
烧 点 以 匀速 向 内 部 草 延 , 当 火 焰 相 交 时 熄灭 ,火焰 熄灭 点 的 集 
- 

[a] 


是 目标 的 骨架 。 

2. 基于 最 大 圆 盘 

根据 几何 学 原理 ,目标 的 骨架 是 由 目标 内 所 有 内 切 圆 盘 的 ”图 12-24 三 角形 形状 物体 
圆心 组 成 ,如 图 12-24 所 示 。 的 骨架 示意 图 


12.6.2 中 轴 变 换 


将 一 个 平面 区 域 简化 成 图 是 一 种 重要 的 结构 形状 表示 法 。 利 用 细 化 技术 得 到 区 域 的 骨 
架 是 常用 的 方法 。 中 轴 变 换 (medial axis transform, MAT) 是 一 种 用 来 确定 物体 骨架 的 细 
化 技术 。 

设 区 域 A 的 边界 点 集 为 B, 区 域 A 的 中 轴 变 换算 法 过 程 是 : 对 A 中 的 每 一 点 也 ,在 也 
中 搜寻 与 它 相 距 最 近 的 点 ; 如 果 区 域内 某 一 点 有 一 个 以 上 边界 点 与 其 有 相同 的 最 小 距离 ， 
则 点 已 必 位 于 对 称 轴 或 中 轴 上 。 也 就 是 说 ,B 中 具有 两 个 或 两 个 以 上 的 点 与 P 同时 最 近 ， 
就 可 认为 P 属 于 A 的 中 线 或 骨架 , 即 点 P 卫 是 A 的 一 个 骨架 点 。 中 轴 是 离 图 像 边界 上 两 点 
具有 最 小 相等 距离 的 点 集 组 成 的 ,将 按 以 上 方法 找 出 的 中 轴 点 连接 起 来 , 便 得 到 中 轴 骨 架 。 

理论 上 ,由 图 形 的 中 轴 上 骨架 及 最 小 距离 还 可 以 重建 图 形 的 边界 。 由 于 每 个 骨架 点 保持 
了 其 与 边界 点 距离 最 小 的 性 质 ,因此 ,用 以 每 个 骨架 点 为 中 心 的 圆 的 集合 (利用 合适 的 量 
度 ) ,就 可 恢复 出 原始 的 区 域 来 。 具 体 即 以 每 个 骨架 点 为 圆心 ,以 前 述 最 小 距离 为 半径 作 圆 ， 
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它们 的 包 络 就 构成 了 区 域 的 边界 ,填充 这 些 圆 就 得 到 原 区 域 。 或 者 以 每 个 骨架 点 为 圆心 ,以 
所 有 小 于 和 等 于 最 小 距离 的 长 度 为 半径 作 圆 , 这 些 圆 的 并 集 就 覆盖 了 整个 区 域 。 中 轴 变 换 
原理 如 图 12-25 所 示 。 


图 12-25 中 轴 变 换 原理 示意 图 


根据 上 述 讨 论 可 知 ,骨架 是 用 一 个 点 与 一 个 点 集 的 最 小 距离 来 定义 的 ,可 写成 
d,(p;B) = inf{d(p,z |z € B} (12-81) 

上 述 定 义 中 距离 量度 既 可 以 是 欧 几 里 德 距离 ,也 可 以 是 市 区 距离 或 棋盘 距离 。 因 为 最 
小 距离 取决 于 所 采用 的 距离 量度 ,所 以 中 轴 变 换 的 结果 也 和 所 采用 的 距离 量度 有 关 。 骨 架 
的 提取 也 可 以 采用 数学 形态 学 方法 。 在 提取 出 骨架 后 ,很 容易 根据 原 图 计算 出 每 点 到 边界 
的 最 短 距离 。 

图 12-26 给 出 了 3 种 类 型 的 区 域 及 采用 欧 氏 距离 测度 算出 的 骨架 。 根 据 图 12-26(a) 可 
知 , 较 粗 短 的 物体 骨架 提供 的 信息 则 较 少 ; 图 12-26(b) 和 (c) 则 表明 , 较 细 长 区 域 或 物体 的 
上 骨架 通常 可 提供 较 多 的 形状 信息 。 


图 12-26 ” 几 种 类 型 的 区 域 和 物体 欧 氏 距离 骨架 


在 某 些 情况 下 ,采用 骨架 表示 区 域 可 能 受 品 声 的 影响 较 大 。 例 如 ,图 12-27(b) 中 的 区 
域 与 图 12-27 (a) 中 的 区 域 略 有 差别 ,可 认为 图 12-27(a) 由 于 噪声 的 影响 成 为 了 图 12-27(b)， 
图 12-27(a) 和 图 12-27(b) 两 者 轮廓 差别 甚 小 ,但 两 者 的 骨架 相差 很 大 。 


(a) (b) 
12-27 骨架 受 噪 声 的 影响 


一 般 情况 下 ,根据 式 (12-81) 求 区 域 骨 架 需 要 计算 所 有 边界 点 到 所 有 区 域内 部 点 的 距 
离 , 计 算 量 较 大 。 实 际 应 用 中 , 求 区 域 骨 架 一 般 采 用 逐次 消去 边界 点 的 迭代 细 化 算法 。 应 
该 方法 需要 注意 如 下 原则 : 

(1) 不 能 消除 线段 的 端点 。 

(2) 不 中 断 原 来 连通 的 点 。 

(3) 不 过 多 侵蚀 区 域 。 
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图 像 处 理 及 应 用 一 一 使 用 MATLAB 分 析 与 实现 


提取 
一 般 
和 形 
标 分 


由 上 述 分 析 可 以 看 出 ,图 像 骨架 提取 算法 实际 上 是 依据 一 定 的 代数 、 儿 何等 数学 原理 ， 
目标 在 图 像 上 的 中 心 像素 轮廓 。 基 于 数学 原理 的 骨架 提取 算法 多 种 多 样 ,图 像 的 骨架 
由 一 些 线 和 曲线 (理想 情况 是 单 像素 宽度 ) 组 成 。 图 像 的 骨架 可 以 提供 一 个 目标 的 尺寸 
状 信息 ,在 数字 图 像 分 析 中 具有 重要 的 地 位 ,图 像 骨 架 化 是 进行 图 像 识 别 、 线 性 图 像 目 
析 的 重要 手段 。 


习题 


1. 图 像 的 几何 特征 包括 哪些 方面 ? 各 有 何 用 途 ? 

2. 试 简 述 如 何 检测 一 个 区 域 或 物体 的 长 轴 和 短 轴 。 

3. 数字 图 像 分 析 中 计算 区 域 的 周 长 有 几 种 方法 ? 各 有 何 特点 ? 

4. 选择 几 个 常用 的 机 械 零件 或 者 五 金工 具 图 形 , 编 写 程序 测量 这 些 图 像 的 几何 特征 


. 试 根据 图 12-28 所 示 图 像 计算 图 中 阴影 区 域 的 周 长 。 

数字 图 像 处 理 技术 中 ,计算 区 域 的 面积 主要 有 哪些 方法 ? 

数字 图 像 的 距离 有 几 种 计算 方法 ? 试 写 出 这 些 计算 公式 。 

什么 是 物体 的 形状 特征 ? 它 主 要 包括 哪些 方面 ? 

. 彩色 图 像 的 颜色 特征 有 哪些 ? 试 分 别 阐述 什么 是 彩色 图 像 的 颜色 矩 和 颜色 聚合 


2 


向 量 。 


条 直 


10. 什么 是 傅 里 叶 描 述 子 ? 传 里 叶 描 述 子 具有 哪些 特点 ? 

11. 选择 一 个 轮廓 复杂 的 物体 和 轮廓 相对 简单 的 物体 , 按 要 求 完成 以 下 实验 : 

(1) 编写 程序 分 别 对 其 轮廓 形状 进行 傅 里 叶 描 述 。 

(2) 将 两 轮廓 分 别 进行 一 定 角度 的 旋转 后 再 进行 傅 里 叶轮 廓 描述 。 

(3) 将 旋转 前 后 的 形状 描述 结果 进行 分 析 对 照 ,总 结 傅 里 叶 描述 子 的 特点 。 

12. 试 根据 如 图 12-29 所 示 图 像 ,分别 计算 图 中 阴影 区 域 的 4 方向 和 8 方向 边界 链 码 。 
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图 12-28 物体 的 周 长 计 算 图 12-29 区 域 的 边界 链 码 


13. 试 根 据 霍 夫 变 换 的 原理 ,证 明 变换 域 极 坐标 系 中 的 一 点 对 应 于 直角 坐标 系 中 的 一 
线 。 

14. 选择 一 张 带 表格 的 票据 图 像 ,检测 表 格 的 倾斜 角度 ,并 进行 校正 。 

15. 什么 是 纹理 分 析 中 的 统计 方法 ? 它 有 何 特点 ? 

16. 简 述 计算 灰 度 共生 和 矩阵 的 主要 步骤 ,编写 程序 实现 灰 度 共生 算 阵 算法 。 


出 
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17. 试 简 述 联合 概率 矩阵 法 的 基本 原理 。 

18. 选择 若干 不 同人 员 同 一 部 位 的 皮肤 图 像 ,编写 程序 计算 各 图 像 的 角 二 阶 距 、 对 比 
度 、 相 关 性 、 炉 等 粗糙 度 指标 。 

(1) 简 述 各 项 指标 的 物理 意义 。 

(2) 依据 计算 所 得 出 的 四 项 指标 ,分 别 按 大 小 进行 排序 。 

(3) 按照 排序 ,逐一 分 析 皮 肤 指 标 与 视觉 感受 是 否 一 致 。 

19. 试 简 述 中 轴 变 换 的 主要 原理 。 

20. 简要 曾 述 骨架 提取 算法 在 图 像 处 理 中 的 作用 和 意义 ,并 编写 程序 对 图 像 进 行 骨 架 
提取 。 
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